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流水 线 、 指 令 集 、 总 线 …… 阅 读本 书 ， 那 都 不 是 事 儿 | 

本 书 手 把 手 地 教 您 从 零 实 现 一 个 具有 五 级 流水 线 、 兼 容 
MIPS32 体 系 结构 、 带 有 Wishbone 总 线 接口 的 处 理 器 ， 并 为 其 
移植 了 嵌入 式 操作 系统 上 CC0S-I， 打 造 属于 您 自己 的 独 一 无 
二 的 计算 机 系统 。 
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内 容 简 介 


本 书 使 用 Verilog HDL 设计 实现 了 一 款 兼 容 MIPS32 指 令 集 架 构 的 处 
理 器 一 OpenMIPS。OpenMIPS 处 理 器 具有 两 个 版 本 ， 分 别 是 教学 版 和 
实践 版 。 教 学 版 的 主要 设计 思想 是 尽量 简单 ， 处 理 器 的 运行 情况 比较 理 
想 化 ， 与 教科 书 相似 ， 便 于 使 用 其 进行 教学 、 学 术 研 究 和 讨论 ， 也 有 助 
于 学 生理 解 课 堂上 讲授 的 知识 。 实 践 版 的 设计 目标 是 能 完成 特定 功能 ， 
发 挥 实际 作用 。 





全 书 分 为 三 篇 。 第 一 篇 是 理论 篇 ， 介 绍 了 指令 集 架 构 、Verilog 
HDL 的 相关 知识 。 第 二 篇 是 基础 篇 ， 采 用 增 量 模型 ， 实 现 了 教学 版 
OpenMIPS 处 理 器 。 首 先 实 现 了 仅 能 执行 一 条 指令 的 处 理 器 ， 从 这 个 最 
简单 的 情况 出 发 ， 通 过 依次 添加 ， 实 现 逻 辑 操 作 指令 、 移 位 操作 指令 、 
空 指令 、 移 动 操作 指令 、 算 术 操 作 指 令 、 转 移 指 令 、 加 载 存储 指令 、 协 
处 理 器 访问 指令 、 异 常 相关 指令 ， 最 终 实现 了 教学 版 OpenMIPS 处 理 
器 。 第 三 篇 是 进 阶 篇 ， 通 过 为 教学 版 OpenMIPS 添 加 Wishbone 总 线 接 
口 ， 从 而 实现 了 实践 版 OpenMIPS 处 理 器 ， 并 与 SDRAM 控 制 器 、GPIO 
模块 、Flash 控 制 器 、UART 控 制 器 、Wishbone 总 线 互 联 窍 阵 等 模块 组 成 
一 个 小 型 SOPC， 然 后 下 载 到 FPGA 芯 片 以 验证 实现 效果 ， 最 后 为 实践 版 
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入 式 系统 应 用 开发 工程 师 、MIPS 平 台 开 发 人 员 以 及 对 处 理 器 内 部 的 实 
现 感 兴趣 的 读者 阅读 ， 也 可 以 作为 高 等 院 校 计算 机 原理 、 计 算 机 体系 结 
构 等 课程 的 实践 参考 书 。 








未 经 许可 ， 不 得 以 任何 方式 复制 或 抄 交 本 书 之 部 分 或 全 部 内 容 。 
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自己 动手 写 处 理 器 ? 


自己 动手 写 处 理 器 ! 





没 错 ， 您 手 上 拿 着 的 就 是 一 本 介绍 如 何 实现 处 理 器 的 书 ， 通 过 阅读 
本 书 ， 您 可 以 实现 世界 上 独一无二 、 独 属于 您 的 处 理 器 。 
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不 信 ? 


ee 那 就 请 您 阅读 本 书 。 
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用 “日 新 月 异 ” 来 形容 这 40 多 年 处 理 器 的 发 展 变化 亦 不 为 过 ， 无 论 是 速 
度 、 集 成 度 ， 还 是 架构 等 许多 方面 都 有 了 前 人 难以 想象 的 变化 。 不 过 可 
惜 的 是 ， 处 理 器 设计 制造 一 直 都 是 高 科技 行业 ， 轻 易 无 法 涉足 。 大 多 数 
人 对 处 理 器 的 直观 印象 就 是 一 个 银白 色 的 小 芯片 ， 有 许多 管 脚 ， 至 于 里 
面 是 如 何 工作 的 ， 则 不 甚 了 解 ， 更 不 用 说 自己 制作 处 理 器 了 。 








笠 运 的 是 ， 在 处 理 器 发 展 的 同时 ， 可 编程 逻辑 器 件 也 在 持续 发 展 。 
可 编程 逻辑 器 件 不 仅 是 技术 的 革新 ， 也 囊 来 了 观念 的 昔 新 、 设 计 流 程 的 
音 新 。 如 今 通过 编写 代码 可 以 在 可 编程 逻辑 器 件 上 实现 十 分 复杂 的 电路 
设计 ， 比 如 处 理 硕 。 于 是 ， 普 通 大 众 也 能 有 机 会 了 解 处 理 器 和 部 的 实现 
原理 ， 甚 至 参与 处 理 器 的 设计 、 研 发 。 








实际 上 ， 目 前 已 经 有 很 多 可 以 下 载 到 可 编程 逻辑 器 件 上 运行 的 处 理 
器 ， 这 些 处 理 器 称 为 软 核 处 理 器 ， 比 如 : NiosII、OR1200、LEON3、 
OpenSparc 等 ， 这 些 软 核 处 理 器 有 的 是 开源 的 ， 有 的 不 是 开源 的 。 笔 者 
在 前 期 深入 阅读 了 几 款 开源 软 核 处 理 器 的 代码 ， 包 括 : OC8051, 
OR1200、LEON3。 其 中 ，OC8051 是 OpenCores 提 供 的 一 款 8 位 两 级 流水 
线 处 理 器 ， 与 Intel 805157, 是 CISC (Complex Instruction Set 
Computer) 类 型 ， 采 用 Verilog HDL 编写 代码 。OR1200 是 OpenCores 提 
供 的 一 亚 32 位 五 级 流水 线 处 理 器 ， 是 RISC (Reduced Instruction Set 
Computer) 类 型 ， 也 采用 Verilog HDL 编写 代码 。LEON3 是 由 Gaisler 
Research 公 司 设计 发 布 的 一 球 32 位 七 级 流水 线 处 理 器 ， 也 是 RISC 类 型 ， 
但 采用 的 是 VHDL 编 写 代 人 码 。 





通过 阅读 上 述 开 源 软 核 处 理 器 的 代码 ， 一 方面 消除 了 笔者 对 处 理 器 
的 神秘 印象 ， 男 一 方面 也 激发 了 笔者 强烈 的 创作 冲动 ， 陆 游 曾 言 : 纸 上 
得 来 终 觉 浅 ， 绝 知 此 事 要 躬 行 。 是 啊 ! 为 何不 自己 也 写 一 个 处 理 器 ?于 
是 世间 又 多 了 一 款 开源 处 理 器 OpenMIPS。OpenMIPS 是 具有 哈佛 结构 的 
32 位 五 级 流水 线 标量 处 理 器 ， 兼 容 MIPS32 体 系 结构 ， 这 样 可 以 使 用 现 
有 的 MIPS 编 译 开 发 环境 。 它 分 为 教学 版 和 实践 版 两 个 版 本 ， 每 个 版 本 
都 使 用 VHDL 和 Verilog HDL 两 种 语言 编写 。 














本 书 以 Verilog HDL 编写 的 版 本 为 例 ， 详 细 介 绍 了 OpenMIPS 从 无 到 
有 、 从 小 到 大 、 一 步 一 步 成 长 完善 的 过 程 。 


写作 目的 


o 捧 掉 处 理 融 贴 着 的 “高 大 上 ?标签 





处 理 器 一 贯 被 人 们 贴 上 “高 大 上 ”“ 高 科技 ?诸如 此 类 的 标签 ， 贴 标 
签 的 原因 就 在 于 人 们 对 此 不 了 解 ， 越 不 了 解 ， 越 觉得 神秘 ， 越 觉得 神 
秘 ， 就 越 不 想 了 解 ， 如 此 , “高 大 上 ”的 标签 算是 贴 牢 了 。 本 书 的 目的 之 
一 束 是 帮助 读者 改变 这 种 固有 的 偏见 ， 从 本 质 上 认识 处 理 融 ， 撕 挥 这 些 
标签 。 简 单 来 说 ， 处 理 占 的 作用 束 是 识别 0、1 编 码 ， 也 就 是 识别 指令 ， 
据 此 进行 各 种 运算 和 数据 处 理 。 处 理 器 只 能 计算 小 学 数学 课堂 上 讲授 的 
四 则 运算 ， 再 加 上 一 些 并 不 复 淋 的 与 、 或 、 非 等 逻辑 运算 ， 其 余 诸 如 平 
方 、 开 方 、 微 分 、 积 分 等 都 是 做 不 了 的 。 是 不 是 很 简单 ? 








o 对 现 有 处 理 絮 相关 书籍 的 补充 


翻 看 现 有 的 处 理 器 相关 书籍 ， 会 有 两 个 体会 :一 个 体会 是 大 多 数 书 
籍 讲 授 的 理论 部 分 太 多 ， 实 践 部 分 太 少 。 过 多 的 理论 、 过 少 的 实践 ， 会 
使 得 读者 知 其 然 ， 不 知 其 所 以 然 ， 第 二 个 体会 是 有 少 部 分 书籍 讲授 处 理 
器 的 实现 ， 但 是 介绍 的 方式 不 太 易 懂 ， 读 者 需要 对 处 理 器 有 一 定 了 解 之 
后 才能 阅读 此 类 书籍 。 因 此 ， 笔 者 想 结合 OpenMIPS 介 绍 处 理 器 实现 ， 
本 书 完全 按照 OpenMIPS 的 实现 过 程 讲 解 ， 从 零 起 步 ， 遇 到 什么 问题 就 
解决 什么 问题 ， 笔 者 认为 这 样 易 于 理解 。 


e 抛砖引玉 


高 手 在 民间 ， 此 言 不 虚 ， 笔 者 写作 此 书 的 第 三 个 目的 就 是 抛 砖 引 
玉 ， 和 希望 有 更 多 人 士 能 够 参与 维护 和 改进 OpenMIPS， 为 其 添加 更 多 的 
功能 ， 或 者 改善 性 能 。 当 然 ， 也 和 希望 出 现 更 多 类 似 的 软 核 处 理 右 ， 这 


样 ， 大 家 可 以 相互 学 习 、 相 互 探 讨 、 取 长 补 短 、 共 同 进 步 。 
Y IN y Y =, 
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适合 对 处 理 器 内 部 的 实现 有 着 强烈 好 奇 心 的 朋友 阅读 ， 通 过 本 书 介 


绍 的 OpenMIPS 处 理 器 的 实现 过 程 ， 您 将 全 方位 地 了 解 32 位 RISC 处 理 器 
的 内 部 设计 。 





适合 不 满足 于 教科 书 的 同学 阅读 ， 本 书 可 以 作为 您 的 实践 参考 书 ， 
帮助 您 理解 书本 上 抽象 的 概念 ， 同 时 培养 动手 能 


适合 正在 从 事 软 核 处 理 器 开 有 发 、 设 计 的 朋友 阅读 ， 本 书 将 给 您 一 些 
经 验 、 一 些 好 的 方法 ， 帮 助 您 事半功倍 。 





适合 正在 从 事 坐 入 式 开 发 的 朋友 阅读 ， 本 书 对 处 理 器 的 一 些 介绍 ， 
A BF RADE Ro 


内 容 安排 


全 书 共 15 章 ， 分 为 三 篇 ， 第 一 篇 是 理论 篇 ， 包 含 第 1、2 章 ， 介 绍 了 
指令 集 架 构 、Verilog HDL 的 相关 知识 。 第 二 篇 是 基础 篇 ， 包 含 第 3 一 11 
半 ， 采 用 增 量 模型 ， 实 现 了 教学 版 OpenMIPS 人 处 理 占 。 第 三 篇 是 进 阶 
篇 ， 包 含 第 12 一 15 章 ， 实 现 了 实践 版 OpenMIPS 处 理 器 ， 并 为 其 移植 了 
岁入 式 实时 操作 系统 kLC/OS-I。 每 章 的 主要 内 容 如 下 。 


e 第 一 篇 “理论 篇 


第 1 章 给 出 了 计算 机 的 简单 组 成 模型 、 简 单 使 用 模型 ， 对 比 了 RISC 
与 CISC， 说 明了 指令 集 架 构 的 作用 ， 并 列举 了 目前 几 种 主要 的 指令 集 
架构 ， 由 于 OpenMIPS 采 用 的 是 MIPS32 指 令 集 架构 ， 所 以 本 章 后 半 部 分 
重点 介绍 了 MIPS32 指 令 集 架构 。 


第 2 章 介 绍 了 FPGA、Verilog HDL 的 基础 知识 ，FPGA 是 可 编程 逻辑 
器 件 的 一 种 ， 本 书 的 实践 版 OpenMIPS 处 理 器 就 将 在 FPGA 上 运行 。 


o 第 二 篇 ”基础 篇 


第 3 章 介 绍 了 教学 版 OpenMIPS 处 理 器 的 设计 蓝图 ， 包 括 设计 目标 、 
处 理 器 接口 ， 以 及 最 终 完 成 时 组 成 OpenMIPS 的 各 个 模块 的 作用 ， 力 图 
使 读者 有 一 个 整体 认识 。 男 外 ， 本 章 还 详 述 了 OpenMIPS 处 理 右 的 实现 
Jike 





第 4 章 实现 了 OpenMIPS 处 理 器 的 第 一 条 指令 ori， 之 所 以 选择 这 条 指 
令 作为 我 们 实现 的 第 一 条 指令 ， 就 是 因为 它 足 够 简单 ， 指 令 ori 用 来 实现 
逻辑 “或 运算 ， 通 过 这 条 简单 指令 的 实现 ， 初 步 建立 了 OpenMIPS 的 五 
级 流水 线 结构 ， 后 续 章 节 实 现 其 余 指 令 的 时 候 ， 都 是 在 这 个 初步 建立 的 
流水 线 结构 基础 上 进行 扩充 的 。 本 章 还 建立 了 用 于 测试 的 小 型 SOPC， 
并 通过 ModelSim 仿 真 验 证 ori 指 令 、 五 级 流水 线 实现 的 正确 与 否 。 





第 5 章 讨论 并 解决 了 流水 线 数据 的 相关 问题 ， 然 后 修改 第 4 章 的 
OpenMIPS， 添 加 实现 了 MIPS32 指 令 集 架构 中 定义 的 逻辑 、 移 位 操作 与 


第 6 章 介 绍 添加 实现 了 MIPS32 指 令 集 架构 中 定义 的 移动 操作 指令 。 


第 7 章 介 绍 添加 实现 了 MIPS32 指 令 集 架构 中 定义 的 算术 操作 指令 。 


第 8 章 介绍 添加 实现 了 MIPS32 指 令 集 架构 中 定义 的 转移 指令 ， 
OpenMIPS 文 持 延 迟 转 移 。 


第 9 章 介 绍 添加 实现 了 MIPS32 指 令 集 架构 中 定义 的 加 载 存 储 指令 。 


第 10 章 介绍 添加 实现 了 MIPS32 指 令 集 架构 中 定义 的 协 处 理 右 CP0， 
以 及 协 处 理 器 访问 指令 。 


第 11 半 介绍 添加 实现 了 MIPS32 指 令 集 架构 中 定义 的 异常 相关 指 
令 ， 并 实现 了 异常 处 理 。 


在 每 一 类 指令 的 实现 过 程 中 ， 都 是 先 介绍 该 类 指令 的 格式 、 作 用 和 
用 法 ， 然 后 介绍 实现 思路 ， 接 着 通过 修改 代码 实现 该 类 指令 ， 最 后 ， 编 
写 测试 程序 ， 使 用 仿真 的 方式 验证 实现 的 正确 性 。 


e 第 三 篇 ” 进 阶 篇 
第 12 章 介绍 在 教学 版 OpenMIPS 处 理 器 的 基础 上 ， 通 过 添加 


Wishbone 总 线 接 口 模块 ， 实 现 了 实践 版 OpenMIPS 处 理 器 。 


第 13 章 讲述 设计 实现 了 基于 实践 版 OpenMIPS 处 理 器 的 小 型 可 编程 
片上 系统 SOPC 的 整个 过 程 。 该 SOPC 包 括 GPIO、UART 控 制 器 、Flash 
控制 器 、SDRAM 控 制 器 等 模块 ， 这 些 模块 都 具有 Wishbone 总 线 接口 ， 
与 OpenMIPS 处 理 器 一 起 挂 接 在 Wishbone 总 线 互联 矩阵 上 。 





第 14 章 将 第 13 章 实现 的 小 型 SOPC 下 载 到 实际 的 硬件 平台 上 ， 编 写 
测试 程序 ， 验 证 实践 版 OpenMIPS 处 理 器 实现 的 正确 性 。 


第 15 章 介绍 了 峙 入 式 实时 操作 系统 hC/OS-II， 并 将 其 移植 到 本 书 设 
计 的 OpenMIPS 处 理 器 上 ， 进 一 步 验证 了 实践 版 OpenMIPS 处 理 器 实现 的 


正确 性 ， 也 为 OpenMIPS 处 理 器 发 挥 实际 作用 葛 定 了 基础 。 
r LE 
本 书 特色 


e 从 无 到 有 、 从 小 到 大 ， 介 绍 一 球 处 理 器 的 成 长 过 程 





在 本 书 之 前 已 有 介绍 软 核 处 理 器 实现 的 书籍 ， 这 些 书 在 介绍 实现 方 
法 时 有 一 个 共同 把: 一 次 考虑 所 有 的 指令 、 所 有 的 情况 ， 然 后 给 出 代 
码 。 笔 者 认为 这 不 是 读者 易于 接受 的 一 种 方法 ， 而 且 这 也 可 能 不 是 作者 
实现 处 理 器 时 采用 的 方法 。 在 本 书 中 ， 笔 者 借鉴 了 软件 开发 中 的 “ 增 量 
模型 "的 概念 ， 使 用 了 一 种 完全 不 同 的 实现 方法 先 考 虑 最 简单 的 情 
况 ， 给 出 代码 ， 然 后 考虑 稍微 多 一 点 的 情况 ， 修 改 、 补 充 代 码 ， 随 着 考 
虑 情况 的 增多 ， 不 停 地 修改 、 补 充 人 代码， 最终， 实现 需求 的 两 个 版 本 。 





NT, KEAN 
OpenMIPS 处 理 器 分 为 教学 版 和 实践 版 两 个 版 本 。 


教学 版 的 主要 设想 是 尽量 简单 ， 比 如 : 在 一 个 时 钟 周 期 内 可 以 取 到 
指令 ， 完 成 存储 、 加 载 数据 ， 这 样 处 理 器 的 运行 情况 〈 比 如 : 流水 线 的 
运行 ) 束 比 较 理想 化 ， 与 教科 书 相 似 ， 代 码 也 很 清晰 简单 ， 便 于 使 用 其 
进行 教学 、 学 术 研 究 和 讨论 ， 也 有 助 于 读者 理解 教科 书 上 讲授 的 计算 机 
的 原理 、 计 算 机 体系 结构 等 知识 。 


实践 版 的 主要 设计 思想 是 使 OpenMIPS 成 为 一 个 实际 可 用 的 处 理 
器 ， 能 够 下 载 到 可 编程 逻辑 器 件 上 ， 运 行 实际 有 用 的 程序 。 为 此 ， 添 加 
了 Wishbone 总 线 接口 ， 这 样 就 能 方便 地 利用 各 种 已 有 的 SDRAM.、 
Flash、GPIO、UART、LCD 等 模块 控制 器 ， 组 成 一 个 SOPC， 完 成 特定 





功能 ， 进 一 步 还 可 为 其 移植 操作 系统 。 


HANE 

本 书 附带 光盘 提供 了 OpenMIPS 的 所 有 源 代码 ， 以 及 一 些 开发 工 
A, Wank. 

e Code 文 件 夹 

提供 了 本 书 每 一 章 涉及 的 OpenMIPS 源 代码 、 测 试 程序 。 

e Tools 文 件 夹 


提供 了 GNU 工 具 链 的 安装 文件 ， 以 及 一 个 小 工具 Bin2Mem.exe， 访 
工具 用 来 将 二 进 制 数 文件 转化 为 可 以 用 于 ModelSim 仿 真 的 格式 。 





e Doc 文 件 夹 


提供 了 本 书 使 用 的 一 些 IP 核 的 说 明和 手册， 包括 UART 控 制 器 、 
SDRAM 控 制 器 、GPIO 模 块 等 。 还 提供 了 FPGA 开 发 平台 DE2 的 说 明 手 
Ht 


e DE2 文 件 夹 


提供 了 用 来 将 程序 写 入 DE2 上 Flash 芯 片 的 工具 ， 在 第 14、15 章 会 用 
All, 
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写作 体会 


在 实现 OpenMIPS 处 理 需 的 过 程 中 ， 笔 者 深刻 体会 到 “罗马 非 一 日 建 
成 ”> 这 句 话 ， 外 表 看 起 来 巨大 、 庞 杂 的 多 马 ， 也 是 通过 人 们 一 步 一 步 、 
-天 一 天 、 一 点 一 点 建成 的 ， 处 理 絮 也 是 如 此 ， 读 者 首先 不 要 被 处 理 器 
的 神秘 吓 到 ， 从 了 最 简单 的 地 方 入 手 ， 逐 步 增加 功能 、 完 善 设 计 ， 一 行 代 
码 一 行 代码 地 书写 ， 不 仅 要 有 实现 处 理 圳 的 远大 目标 ， 还 要 确立 切实 可 
操作 的 短期 目标 ， 比 如 本 周 实现 除法 指令 ， 下 周 实现 转移 指令 ， 诸 如 此 
类 ， 等 有 一 天 你 突然 回 涉 ， 会 及 现 ， 原 来 已 经 走 了 那么 远 ， 实 现 了 那么 
多 功能 。 李 白 有 诗 云 : 两 尾 猿 声 啼 不 住 ， 轻 舟 已 过 万 重山 。 当 是 此 意 。 

















处 理 器 实现 了 ， 但 要 把 它 的 实现 过 程 明白 地 表达 出 来 ， 让 读者 理 


解 ， 则 又 是 一 件 难 事 。 笔 者 从 开始 写作 到 最 终 完 稿 的 这 一 过 程 中 ， 一 
承受 着 巨 大 的 王 获 ， 儿 度 欲 放 径 写作 ， 所 圣 的 是 最 终 坚 持 了 下 来 。 


最 后 ， 我 想 对 各 位 读者 说 : 





但 是 
一 个 人 的 处 理 器 是 骄 做 的 
让 我 们 骄傲 一 次 
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可 编程 逻辑 器 件 与 Verilog HDL 


FA Œ oo 
21% 处理 器 与 MIPS 
时 间 开 始 了 ! 
—— HA + 1949 
让 我 们 以 一 句 诗意 的 话 ， 开 始 本 书 的 阅读 。 


时 间 从 1971 年 11 月 15 日 开始 ， 那 一 天 ，Pmtel 发 布 了 世界 上 第 一 款 单 
芯片 微 处 理 器 4004。 


1.1 计算 机 的 简单 模型 


计算 机 很 复杂 ， 可 以 听 歌 、 看 电影 、 上 网 、 玩 游戏 ， 内 部 是 怎么 工 
作 的 ， 这 个 问题 太 可 怕 了 ， 太 复 林 了 。 


计算 机 很 简单 ， 只 可 以 做 加 、 减 、 乘 、 除 、 逻 辑 、 移 位 、 转 移 、 存 
储 、 加 载 等 几 类 的 操作 ， 太 简单 了 。 


RR? 简单 ? 其 实 取决 于 个 人 对 事物 的 认识 程度 ， 认 识 得 越 多 ， 了 
解 得 越 深 刻 ， 那 么 就 越 接 近 本 质 ， 而 本 质 往 往 都 是 简单 的 ， 比 如 大 名 易 
易 的 质 能 方程 ， 一 个 简单 的 式 子 融 解释 了 质量 与 能 量 的 关系 。 





计算 机 就 是 一 台 计 算 的 设备 ， 而 且 是 一 全 很 基础 的 计算 设备 ， 只 能 
计算 小 学 数学 谍 符 上 讲授 的 四 则 运算 ， 再 加 上 一 些 并 不 复杂 的 与 、 或 、 
非 等 逻辑 和 运算， 其 余 诸如 平方 、 开 方 、 微 分 、 积 分 等 都 是 做 不 了 的 。 有 
读者 会 有 疑惑 ， 你 说 得 太 简 单 了 吧 ， 别 急 ， 且 听 我 慢 慢 道 来 。 


111 计算 机 的 简单 组 成 模型 


计算 机 的 组 成 有 三 大 部 分 : 处 理 器 (Central Processing Unit, 
CPU) 、 输 入 输出 (Input/Output，1/O) ~ Fits (Memory) 。 处 理 器 
从 存储 器 中 获取 指令 ， 然 后 按照 指令 执行 一 定 的 操作 ， 输 入 /输出 用 来 
提供 运算 数据 、 显 示 运 算 结果 。 如 图 1-1 所 示 。 














存储 器 





Br N 








01011010 | 
01101001 
4 > Arh FH BS 输出 
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输入 


图 1-1 计算 机 的 简单 组 成 模型 





存储 此 中 存储 的 是 指令 ， 指 令 束 是 一 条 运算 命令 ， 比 如 : 将 a 与 b 相 
加 ， 结 果 存 储 到 c 中 ， 处 理 器 按照 命令 执行 即 可 。 有 目前 的 计算 机 古 一 个 
二 进 制 的 世界 ， 所 有 的 信息 都 是 用 0、1 组 合 来 表示 的 ， 所 以 一 条 指令 就 
是 一 串 0、1 编 码 ， 正 如 图 1-1 所 示 。 处 理 器 内 部 具有 译 码 功能 ， 用 来 解 
释 接收 到 的 0、1 编 码 表 示 的 运算 类 型 ， 据 此 进行 运算 。 


1.1.2 ”计算 机 的 简单 便 用 模型 


我 们 使 用 计算 机 上 网 、 办 公 ， 都 是 通过 一 定 的 应 用 程序 实现 的 ， 而 
这 些 应 用 程序 实际 就 是 一 批 指 令 的 集合 ， 当 然 ， 这 里 的 “一 批 ? 指 的 是 指 
令 的 数目 庞大 ， 实 际 上 种 类 是 非常 少 的 ， 只 有 几 百 条 ， 第 用 的 也 就 几 十 
条 。 通 过 这 些 指令 的 组 织 、 配 合 ， 葡 实现 了 目前 丰富 多 彩 的 应 用 。 











理论 上 ， 可 以 直接 使 用 0、1 编 码 进 行程 序 设计 ， 但 是 那样 显然 太 不 
方便 、 容 易 出 错 ， 于 是 人 们 使 用 一 些 助 记 符 来 表示 各 种 指令 ， 这 就 是 汇 
编 指令 ， 使 用 汇编 程序 将 沪 编 指令 翻译 为 计算 机 可 以 识别 的 0、1 编 码 ， 
后 来 ， 又 发 明了 高 级 语言 ， 其 语法 、 使 用 方式 比 汇编 更 加 方便 、 更 加 易 





于 理解 。 一 般 使 用 编译 程序 将 高 级 语言 编写 的 程序 翻译 为 汇编 指令 ， 然 
后 再 使 用 汇编 程序 将 其 翻译 为 0(、1 编 码 。 本 质 上 是 一 样 的 。 如 图 1-2 所 
示 。 





高 级 语言 编写 的 源 程序 


编译 | 
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计算 机 可 识别 的 0、1 编码 









































图 1-2 计算 机 的 简单 使 用 模型 


这 就 是 计算 机 的 简单 使 用 模型 ， 无 论 是 视频 软件 、 浏 览 器 ， 还 是 其 
他 任何 软件 ， 无 论 是 使 用 C# 开 发 、Java 开 发 ， 还 是 使 用 任何 其 他 语言 开 
发 ; 无论 是 在 Windows 环 境 下 运行 、Android 环 境 下 运行 ， 还 是 在 其 他 任 
何平 台 下 运行 ， 无论 是 在 ARM 处 理 上 运行 、Itel 处 理 器 上 运行 ， 还 是 在 
其 他 任何 处 理 器 上 运行 ; 无论 是 在 银河 二 号 这 样 的 大 型 机 运行 、 个 人 使 
用 的 PC 上 运行 ， 还 是 在 其 他 任何 机 器 上 运行 ， 都 遵循 这 样 的 一 套 使 用 
模型 。 











忆 结 一 下 ， 计 算 机 只 识别 0、1 编 码 串 ， 任 何 程 序 最 终 都 要 转变 为 
0、1 编 码 串 ， 而 且 0、1 编 码 的 种 类 是 有 限 的 ， 计 算 机 按照 0、1 编 码 的 命 
令 进 行 工 作 。 这 样 一 说 ， 读 者 应 该 觉得 计算 机 很 简单 了 吧 。 


在 计算 机 中 处 于 核心 地 位 的 是 处 理 器 ， 也 称 为 CPU， 作 用 是 识别 
0、1 编 码 ， 据 此 进行 各 种 运算 和 数据 处 理 。 本 书 的 目标 惑 是 实现 一 个 





CPU 。 


12 ”架构 与 指令 集 


类 似 于 不 同 国 家 的 人 使 用 不 同 的 文字 ， 不 同 的 处 理 器 也 使 用 不 同 的 
指令 ， 这 样 ， 为 处 理 需 A 编 写 的 程序 不 能 直接 在 处 理 器 B 上 使 用 ， 需 要 
重新 编写 ， 然 后 再 次 编译 、 汇 编 后 才 可 人 使用， 减低 了 软件 的 移植 性 。 显 
然 ， 极 为 不 便 。 


IBM 为 了 让 自己 的 一 系列 计算 机 能 使 用 相同 的 软件 ， 免 去 重复 编写 
软件 的 痛 兰 ， 在 它 的 System/360 计 算 机 中 引入 了 指令 集 架 构 〈Instruction 
Set Architecture, ISA) 的 概念 ， 将 编程 所 需要 了 解 的 硬件 信息 从 硬件 系 
统 中 抽象 出 来 ， 这 样 软 件 人 员 就 可 以 面 癌 ISA 进 行 编程 ， 开 发 出 来 的 软 
件 不 经 过 修改 就 可 以 应 用 在 符合 该 ISA 的 所 有 计算 机 上 。ISA 用 来 描述 
编程 时 用 到 的 抽象 机 器 ， 而 非 这 种 机 器 的 具体 实现 ， 从 软件 人 员 的 角度 
来 看 ，ISA 包 括 一 套 指令 集 和 一 些 寄存 器 ， 知 道 它们 就 可 以 编写 程序 
Ja 





与 ISA 对 应 的 一 个 概念 是 微 架 构 (Microarchitecture) ， 后 者 是 前 者 
的 一 个 实现 ， 比 如 Intel 的 许多 处 理 器 都 是 遵循 x86 的 ISA， 但 是 每 一 款 人 处 
理 嚣 都 有 自己 的 微 架构 。ISA 好 比 是 设计 规范 ， 微 架构 则 是 具体 实现 ， 
同样 的 ISA， 不 同 的 微 架 构 ， 会 市 来 不 同 的 性 能 。 








1.2.1 CISCSRISC 





从 大 的 方面 ， 根 据 ISA 的 不 同 可 以 将 计算 机 分 为 两 类 :复杂 指令 集 
计算 机 〈Complex Instruction Set Computer, CISC) 和 精简 指 令 集 计算 


机 (Reduced Instruction Set Computer, RISC) 。 它 们 的 主要 区 别 是 ， 
CISC 的 每 条 指令 对 应 的 0、1 编 码 串 长 度 不 一 ， 而 RISC 的 每 条 指令 对 应 
的 0、1 编 码 串 长 度 是 固定 的 。 








在 计算 机 发 展 的 早期 ， 人 们 使 用 汇编 语言 编程 ， 偏 好 强大 好 用 的 指 
令 集 ， 处 理 器 的 设计 人 员 于 是 将 指令 集 设计 得 更 强大 、 更 灵活 ， 并 且 那 
个 时 期 的 存储 器 既 昂贵 且 速 度 慢 ， 因 此 指令 使 用 了 变 长 编码 ， 以 节约 存 
储 空 间 ， 由 于 一 条 指令 就 能 完成 很 多 功能 ， 从 而 减少 了 对 内 存 的 访问 次 
数 ， 这 样 也 减少 了 缓慢 的 存储 器 访问 对 程序 性 能 的 影响 。 典 型 的 CISC 
指令 集 架 构 就 是 Intel 的 x86 ISA。 上 世纪 70 年 代 中 期 ， 人 们 发 现 CISC 指 
令 集中 的 各 种 指令 ， 其 使 用 频率 相差 上 甚 殊 ， 大 约 有 20% 的 指令 会 被 反复 
使 用 ， 占 整个 程序 代码 的 80%。 而 余下 80% 的 指令 却 不 经 常 使 用 ， 只 占 
整个 程序 代码 的 20%， 显 然 ， 这 种 结构 是 不 太 合 理 的 。 于 是 人 们 提出 将 
指令 集 和 处 理 器 进行 章 新 设计 ， 减 少 那些 使 用 不 多 的 指令 ， 只 保留 常用 
的 简单 指令 ， 这 样 处 理 器 就 不 需要 浪费 太 多 的 晶体 管 去 做 那些 很 复杂 又 
很 少 使 用 的 功能 ， 于 是 产生 了 RISC。1979 年 美国 加 州 大 学 伯克利 分 校 
[David “Pattern 首先 提出 了 RISC 的 概念 ，RISC 并 不 只 是 简单 地 减少 指 
令 ， 更 主要 的 目的 是 研究 如 何 使 计算 机 的 结构 更 加 简单 合理 以 提高 运算 
速度 。 其 特点 是 指令 长 度 固 定 、 指 令 格 式 种 类 少 、 寻 址 方式 种 类 少 、 大 
量 使 用 寄存 器 等 。 由 于 在 RISC 中 使 用 的 指令 大 多 数 是 简单 指令 且 都 能 
在 一 个 时 钟 周期 内 完成 ， 因 而 处 理 器 的 频率 得 以 大 幅 提 升 ， 同 时 易于 设 
计 流 水 线 。RISC 是 计算 机 发 展 历史 上 的 一 个 里 程 碑 ， 以 致 有 人 开玩笑 
地 把 RISC 定 义 为 : 1985 年 之 后 发 布 的 所 有 处 理 器 。 























Itel 也 和 尝试 做 RISC 处 理 器 ， 但 是 因为 兼容 性 问题 ， 没 有 成 功 ， 后 来 
在 1995 年 ，Intel 的 David B.Papworth 和 他 的 同事 一 起 设计 了 Pentium Pro 
处 理 器 ， 在 这 个 处 理 占 中 ，x86 指 令 先 被 解码 为 类 似 于 RISC 指 令 的 微 操 


作 (microoperation， 人 简称 为 uops) ， 之 后 的 执行 过 程 采 用 RISC 内 核 ， 
这 种 方式 一 直 延 续 至 今 


o 


1.2.2 ”主要 的 几 种 ISA 


目前 并 没有 一 种 统一 的 ISA 为 各 个 处 理 器 厂商 所 接受 ， 而 是 存在 多 
种 ISA， 就 像 这 个 世界 存在 多 种 语言 一 样 ， 但 是 主要 的 语言 只 有 几 种 : 
汉语 、 英 语 、 法 语 、 俄 语 等 。 主 要 的 ISA 也 只 有 几 种 : x86. ARM, 
SPARC、POWER、MIPS， 除 了 x86 是 CISC ISA 外 ， 其 余 都 是 RISC 
ISA。 





1. x86 


x86 架 构 于 1978 年 推出 的 Intel 。” 8086 处理 器 中 首 度 出 现 ， 三 年 后 ， 
Intel 8086 为 IBM PC 所 选用 ， 之 后 x86 便 成 为 了 个 人 计算 机 的 标准 平台 ， 
成 为 了 历史 上 最 成 功 的 指令 集 架 构 。 目 前 绝 大 多 数 个 人 计算 机 使 用 的 都 
是 兼容 x86 指 令 集 架构 的 处 理 器 。 


2. ARM 


1985 年 ， 英 国 的 Acorn 公 司 设计 了 上 自己 的 第 一 代 32 位 、6MHz 处 理 
器 ， 命 名 为 Acorn RISC Machine， 简 称 为 ARM1。1990 年 ， 由 苹果 公 
司 、VLSI 公 司 共同 出 资 ， 改 组 Acorn 为 ARM 计 算 机 公司 ， 同 时 不 再 涉 
具体 芯片 生产 ， 只 出 售 卫 核 。ARM 公 司 设 计 低 功 耗 、 高 性 能 的 CPU 内 
辫 ， 然 后 授权 给 其 他 公司 ， 后 者 设计 生产 具体 的 处 理 器 心 亡 。 





>F 


FHF ARM fill FAIRE (RAS, ELTON EKA SUA, FL 
随 着 智能 手机 、 平 板 等 移动 设备 的 普及 ，ARM 公 司 发 展 得 非 第 迅速 。 





ARM 架 构 从 v4、v4T、v5、v5E、v6， 发 展 到 v7， 其 中 v7 又 分 为 v7- 
A、v7-R、v7-M 等 多 种 ， 芋 果 公 司 的 A9 处 理 器 采用 的 就 是 ARM v7-A 架 
构 。 


3. SPARC 


SPARC (Scalable Processor ARChitecture， 可 扩展 处 理 器 架构 ) 源 
自 美国 加 州 大 学 伯克利 分 校 上 世纪 80 年 代 的 研究 ， 由 Sun 公 司 在 1985 年 
首先 提出 。1989 年 成 为 商用 架构 ， 生 产 出 SPARC 系 列 的 处 理 器 ，Sun 将 
其 用 在 高 性 能 工作 站 和 服务 器 上 。SPARC 架 构 目 前 的 版 本 有 v8、v9。 


SPARC 架 构 对 外 完全 开放 ， 在 此 基础 上 出 现 了 一 些 开 放 源 代码 的 处 
理 器 ， 比 如 : Sun 公 司 的 UltraSPARC T1、LEON 等 。 其 中 ，LEON 是 一 
种 SPARC v8 架 构 的 处 理 器 ， 至 今 已 发 布 到 了 LEON4。 最 初 的 LEON1 与 
LEON2 由 欧洲 航天 局 发 布 ，LEON3 由 Gaisler Research Hr] Kit KH, 
2008 年 Aeroflex 收 购 了 Gaisler Research 公 司 ， 并 于 2010 年 1 月 发 布 了 
LEON4， 不 过 LEON4 人 至 今 还 没有 公布 源 代码 。LEON 系 列 使 用 VHDL 编 
写 代码 ， 原 计划 是 使 用 在 航天 器 上 。 


4. POWER 


POWER (Performance Optimization With Enhanced RISC) 是 由 IBM 
ZA WIT FP AC ARISCO RER. BME IRS IRA aE 
大 型 机 、 小 型 机 及 工作 站 都 采用 POWER 架构 的 微 处 理 器 作为 其 主 CPU 
使 用 ; 


1991 年 Apple、IBM 和 Motorola 三 家 公司 成 立 了 了 AIM 联盟 (AIM 为 
Apple、IBM、Motorola 的 首 字 母 ) ， 对 POWER 架构 进行 了 修改 ， 形 成 
了 PowerPC 架 构 。2004 年 IBM 发 起 了 Power.org 联 盟 ， 发 布 了 统一 的 指令 


集 架 构 ， 将 POWER 与 PowerPC 统 一 到 新 的 Power 架 构 中 。 
5. MIPS 


MIPS 的 含义 是 无 内 锁 流 水 线 微 处 理 器 (Microprocessor without 
Interlocked Piped Stages) ， 是 上 世纪 80 年 代 诞 生 的 RISC CPU 的 重要 代 
表 ， 其 设计 者 John Hennessy 时 任 斯 坦 福 大 学 的 教授 。 当 初 的 设计 基于 以 
下 理念 : 使 用 相对 简单 的 指令 ， 结 合 优秀 的 编译 器 以 及 采用 流水 线 执行 
虽 令 的 硬件 ， 就 可 以 用 更 少 的 唱 元 面积 生产 更 快 的 处 理 器 。 这 一 理念 是 
如 此 的 成 功 ， 以 至 于 1984 年 就 成 立 了 MIPS 计 算 机 系统 公司 对 MIPS 架 构 
进行 商业 化 。 在 随后 的 十 几 年 中 ， MIPS 架 构 在 很 多 方面 得 到 发 展 ， 在 
工作 站 和 服务 器 系统 中 得 到 了 很 多 应 用 。MIPS 架 构 也 从 MIPS I, MIPS 
I MIPS II, MIPS IV, MIPS V、MIPS32 发 展 到 MIPS64。John 
Hennessy 与 RISC 概 念 的 提出 者 David Pattern 合 著 了 计算 机 领域 影响 甚 广 
的 教科 书 《 计 算 机 体系 结构 一 一 量化 研究 方法 》， 该 书 至 今 已 出 到 第 五 
版 。 























内 的 龙芯 处 理 器 采用 的 就 是 MIPS 架 构 。 本 书 计划 实现 的 处 理 器 
也 采用 MIPS 架 构 ， 这 里 涉及 两 个 问题 。 


(1) 为 什么 要 采用 一 个 现 有 的 指令 集 架构 ? 








这 是 因为 现 有 的 指令 集 染 构 已 经 形成 了 一 套 完 善 的 环境 ， 其 中 既 有 
成 熟 的 编译 器 ， 还 有 大 量 的 应 用 程序 ， 采 用 现 有 的 指令 集 架 构 ， 都 可 以 
直接 使 用 这 些 环境 。 反 之 ， 如 宁 设 计 目 己 独 有 的 一 套 指 令 集 架 构 ， 那 么 
eas. MAP ei BA CET RR, DPR BK. devia a E 
喻 ， 一 个 人 当然 可 以 发 明 、 使 用 目 己 独 有 的 语言 ， 但 是 如 何 与 别人 交流 
呢 ? 无 法 与 人 交流 ， 再 优秀 的 语言 也 注定 会 消失 。 




















(2) 为 什么 要 采用 MIPS 架 构 ? 


首先 MIPS 的 设计 是 RISC 架 构 中 的 经 典 之 作 ， 很 多 处 理 器 都 吸收 了 
其 中 的 设计 思想 ;其 次 ，MIPS 架 构 中 指令 的 专利 期 已 过 ， 可 以 目 由 使 
用 。 





本 章 接 下 来 将 重点 介绍 MIPS 指 令 集 架构 。 
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MIPS 指 令 集 架构 自 上 世纪 80 年 代 出 现 后 ， 一 直 在 进行 更 新 换代 ， 
从 最 初 的 MIPS I 到 MIPS V， 发 展 到 可 文 持 扩展 模块 的 MIPS32、MIPS64 
系列 ， 再 到 集成 代码 压缩 技术 的 microMIPS32、microMIPS64。 每 个 
MIPS ISA 都 是 其 前 一 个 的 超 集 ， 没 有 任何 遗漏 ， 只 有 增加 新 的 功能 。 





1. MIPS | 


提供 加 载 / 存 储 、 计 算 、 跳 转 、 分 文 、 协 处 理 及 其 他 特殊 指令 。 访 
指令 集 架 构 用 于 最 初 的 MIPS 处 理 器 R2000/R3000。R2000 是 1985 年 推出 
的 首 球 MIPS CPU， 由 110000 个 晶体 管 组 成 ， 是 一 个 8MHz 的 32 位 处 理 
器 。R3000 是 R2000 的 下 一 代 产 品 ， 与 前 者 相 比 仅仅 是 时 钟 频 率 不 同 而 
ae 


2. MIPS II 


增加 了 自 陷 指令 、 链 接 加 载 指 令 、 条 件 存储 指令 、 同 步 指 令 、 可 能 
分 文 指 令 、 平 方 根 指 令 。 最 初 计 划 用 在 MIPS 处 理 器 R6000 上 ， 但 由 于 工 
艺 选 择 的 问题 ，R6000 从 1988 年 开始 设计 后 ， 束 一 直 问 题 不 断 ， 最 终 示 
能 大 规模 生产 。 但 MIPS I 指令 集 架 构 是 后 期 MIPS32 指 令 集 架构 的 直接 
先驱 。 











3. MIPSIII 


提供 了 32 位 指令 集 ， 同 时 支持 64 位 指令 集 。 最 初 用 于 MIPS 处 理 器 
R4000。R4000 是 于 1991 年 推出 的 64 位 处 理 器 ， 首 次 加 入 了 浮 点 处 理 器 


单元 ， 主 时 钟 频率 提高 到 了 100MHz。 后 来 出 现 了 一 系列 的 R4000 处 理 
ae 


4. MIPSIV 


在 MIPS II 基础 上 增加 了 条 件 移动 指令 、 预 取 指 令 以 及 一 些 浮 点 指 
令 。 最 初 用 于 MIPS 处 理 器 R8000， 后 来 应 用 于 R5000/R10000。R5000 与 
R10000 虽 然 使 用 相同 的 指令 集 架 构 ， 但 是 两 者 微 架 构 的 设计 理念 完全 不 
同 。R5000 于 1995 年 推出 ， 采 用 的 是 经 典 的 五 级 流水 线 、 顺 序 执行 。 
R10000 于 1996 年 推出 ， 采 用 的 是 乱 序 执行 。 


5. MIPSV 


在 MIPS IV 的 基础 上 增加 了 可 以 提高 代码 生产 效率 和 数据 转移 效率 
的 指令 。 但 是 没有 任何 一 个 处 理 器 基于 该 架构 。MIPS V 指 令 集 架构 是 
后 期 MIPS64 指 令 集 架 构 的 直接 先驱 。 





6. MIPS32/64 


MIPS32/64 于 1998 年 提出 ，MIPS32 以 MIPS II 架构 为 基础 ， 选 择 性 地 
加 入 了 MIPS III, MIPS IV, MIPS V， 提 高 了 代码 生成 和 数据 移动 的 效 
率 。MIPS64 以 MIPS V 架 构 为 基础 ， 同 时 兼容 MIPS32。 该 架构 第 一 次 包 
含 了 被 称 为 协 处理 器 0 的 “CPU 控制 ?功能 。1999 年 以 后 设计 的 大 多 数 
MIPS 处 理 器 都 与 该 标准 兼容 。2003 年 ， 发 布 了 MIPS32/64 指 令 集 架 构 的 
第 二 版 (Release 2) ， 也 称 为 MIPS32/64 R2。 最 新 的 是 第 五 版 (Release 
5) ， 也 称 为 MIPS32/64 R5。 但 目前 广泛 使 用 的 是 第 二 版 ， 非 常 成 功 的 
MIPS AK, 24K ¥% Ji) Ab FH EL EMIPS32 R2 架 构 。 








MIPS32/64 在 基本 指令 的 基础 上 ， 还 提供 了 一 些 面 向 特定 应 用 的 指 


令 ， 这 些 指令 采用 特定 应 用 扩展 (Application-Specific Extensions， 
ASE) 的 形式 。 一 种 处 理 器 是 否 实现 了 某 种 扩展 ， 可 以 通过 设置 标准 的 
配置 寄存 器 指明 。 主 要 的 扩展 列举 如 下 。 








e MIPS 16e: 是 专门 为 嵌入 式 系 统 及 存储 空间 有 限 情 况 下 的 应 用 

而 设计 的 ， 可 以 在 一 个 程序 中 执行 16 位 和 32 位 两 种 混合 长 度 的 
和 令 ， 能 使 最 终 代 码 长 度 减 省 40%。MIPS32、MIPS64 都 支持 

MIPS 16e。 

SmartMIPS: 是 为 了 满足 智能 卡 和 灵活 小 系统 的 市 场 需要 而 设 

计 的 ， 是 一 套 能 高 效 节 省 存储 空间 的 扩展 指令 集 ， 此 外 还 能 提 

高 智能 卡 领域 非常 关键 的 加 密 运 算 的 性 能 。MIPS32 支 持 

SmartMIPS. 

MIPS-3D: 提供 了 更 好 的 几何 运算 处 理 ， 具 有 成 对 单 精度 数据 

类 型 ， 还 提供 专用 指令 来 加 快 对 该 类 型 数据 的 处 理 。MIPS64 

支持 MIPS-3D， MIPS32 第 二 版 也 支持 MIPS-3D。 

e MCU: Micro-Control Unit 微 控制 单元 ， 增 强 了 内 存 映射 TO 的 
处 理 、 提 供 了 更 低 的 中 断 延 迟 。MIPS32、MIPS64 都 支持 
MCU。 














7. microMIPS32/64 


microMIPS32/64 指 令 集 架构 集成 了 16 位 和 32 位 优化 指令 的 高 性 能 代 
码 压缩 技术 ， 保 持 了 98% 的 MIPS32 性 能 ， 同 时 至 少 减少 了 30% 的 代码 体 
具 ， 从 而 降低 已 片 成 本 ， 也 有 助 于 降低 系统 功 耗 。MIPS “MI14K 内 核 是 
MIPS 科 技 于 2009 年 发 布 的 首 款 遵 循 microMIPS 指 令 集 架构 的 MIPS32 兼 
容 内 核 。 








MIPS 指 令 集 架构 的 演变 可 以 使 用 图 1-3 搬 述 。 注 意图 中 没有 Release 





4， 这 是 因为 对 于 很 多 人 来 说 ，4 是 个 不 吉利 的 数字 ， 所 以 MIPS 没 有 发 


布 Release 4， 而 是 直接 发 布 Release 5. 
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21-3 MIPS 指 令 集 架构 的 演变 


1.4 MIPS32 指 令 集 架构 简介 


本 书 设 计 的 处 理 器 遵循 MIPS32 Release 1 架构 ， 所 以 本 节 介 绍 的 
MIPS32 指 令 集 架 构 指 的 就 是 MIPS32 Release 1. 


1.4.1 数据 类 型 


指令 的 主要 任务 就 是 对 操作 数 进 行 运 算 ， 操 作 数 有 不 同 的 类 型 和 长 
度 ，MIPS32 提 供 的 基本 数据 类 型 如 下 。 








。 位 (b) : 长 度 是 1bit。 

e FA (Byte): 长 度 是 8bit。 

e Ef (Half Word) : 长 度 是 16bit。 

e 7 (Word) : 长 度 是 32bit。 

e X (Double Word) : 长 度 是 64bit。 


此 外 ， 还 有 32 位 单 精度 浮 点 数 、64 位 双 精 度 浮 点 数 等 。 


1.4.2 ”寄存 器 


在 前 文 介绍 RISC 的 特点 时 提 到 一 点 : 大 量 使 用 寄存 器 。 这 是 因为 
寄存 器 的 存 取 可 以 在 一 个 时 钟 周 期 内 完成 ， 同 时 也 简化 了 寻 址 方式 。 
MIPS32 的 指令 中 除 加 载 /存储 指令 外 ， 都 是 使 用 寄存 器 或 立即 数 作 为 操 
作 数 的 。MIPS32 中 的 寄存 器 分 为 两 类 : 通用 寄存 器 (General Purpose 





Register, GPR) 、 特 殊 寄存 器 


MIPS32 架 构 定 义 了 32 个 通用 寄存 器 ， 使 用 $0、$1...$31 表 示 ， 都 是 
32 位 。 其 中 $0 一 般 用 做 常量 0。 





在 人 硬件 上 没有 强制 指定 寄存 器 的 使 用 规则 ， 但 是 在 实际 使 用 中 ， 这 
些 寄存 器 的 用 法 都 遵循 一 系列 约定 ， 例 如 : 寄存 器 $31 一 般 存 放 子 程序 
的 返回 地 址 。MIPS32 中 通用 寄存 器 的 约定 用 法 如 表 1-1 所 示 。 在 本 书 大 
部 分 章节 中 ， 测 试 程 序 都 是 直接 使 用 汇编 指令 编写 的 ， 对 寄存 器 的 约定 
用 法 还 不 需要 十 分 在 意 ， 但 是 本 书 的 最 后 一 章 移植 HC/OS-I 时 ， ae 
及 C 语 言 、 汇 编 混合 编程 ， 对 寄存 器 的 约定 用 法 就 需要 十 分 在 意 了 。 

者 届时 可 以 体会 表 1-1 中 各 个 寄存 器 的 约定 用 法 。 

















表 1-1 MIPS32 中 通用 寄存 器 的 约定 用 法 





寄存 器 名 字 | 约定 命名 


UNE. SEHE 
ee CAN 


m ui 





g an aea, 子 程序 使 用 时 可 以 不 用 存 











O EZ 存 右 值 


$16~$23 | s0-s7 || 的 子 程序 必须 存储 旧 的 值 并 在 退出 前 恢 
复 ， 对 调用 程序 来 说 值 不 变 
i FF RAFI DL 


2. RRA BF FF at 





MIPS32 架 构 中 定义 的 特殊 寄存 器 有 三 个 : PC (Program ”Counter 程 
序 计 数 器 ，) . HI (乘除 结果 高 位 寄存 器 )、 Ke ee 
器 ) 。 进 行 乘 法 运算 时 ，HIL 和 LO 保存 乘法 运算 的 结果 ， 其 中 HI 存储 高 
32 位 ，LO 存 储 低 32 位 ;进行 除法 运算 时 ，HIL 和 LO 保存 除法 运算 的 结 
果 ， 其 中 HI 存储 余数 ，LO 存 储 丙 。 
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jad 








数据 在 存储 器 中 是 按照 字 节 存放 的 ， 处 理 器 也 是 按照 字 节 访问 存储 
器 中 的 指令 或 数据 ， 但 是 如 果 需 要 读 出 一 个 字 ， ie 比如 
读 出 的 是 mem[n]、mem[n+1]、mem[n+2]、mem[n+3] 这 四 个 字 节 ， 那 么 


最 终 交 给 处 理 器 的 有 两 种 结果 。 


e {mem|n],mem[n+1],mem[n+2],mem[n+3]} 


e {mem[n+3],mem[n+2],mem[n+1],mem|[n]} 





前 者 称 为 大 端 模式 (Big-Endian) ， 也 称 为 MSB (Most Significant 
Byte) ， 后 者 称 为 小 端 模式 〈Little-Endian) ， 也 称 为 LSB (Least 
Significant Byte) 。 在 大 端 模式 下 ， 数 据 的 高 位 保存 在 存储 器 的 低地 址 
中 ， 而 数据 的 低位 保存 在 存储 器 的 高 地 址 中 。 图 1-4 给 出 0x12345678 在 
两 种 模式 下 的 存储 情况 。 本 书 实现 的 处 理 器 采用 的 是 大 端 模 式 〈Big- 
Endian) 。 








低地 址 jay Hi HE 


大 端 模 式 12 34 56 78 
ANN 78 56 34 12 


图 1-4 大、 小 端 模式 下 存储 0x12345678 的 区 别 


1.44 指令 格式 


MIPS32 架 构 中 的 所 有 指令 都 是 32 位 ， 也 就 是 32 个 0、1 编 码 连 在 一 
起 表示 一 条 指令 ， 有 三 种 指令 格式 。 如 图 1-5 所 示 。 其 中 op 是 指令 码 、 
func 是 功能 人 码 。 

















31 26 25 21 20 16 15 11 10 65 0 
























































op rs rt rd sa func R 类 型 
6 位 5 位 5 位 5 位 5 位 6 位 

31 26 25 21 20 16 15 0 
op rs rt | immediate I 类 型 
6 位 5 位 5 位 16 位 

31 26 25 0 
op address J 类 型 
6 位 26 位 








图 1-5 MIPS32 架 构 中 的 三 种 指令 格式 


(1) R 类 型 : 具体 操作 由 op、func 结 合 指定 ，rs 和 rt 是 源 寄存 器 的 
编号 ，rd 是 目的 寄存 器 的 编号 ， 比 如 : 假设 目的 寄存 器 是 $3， 那 么 对 应 
的 rd 就 是 00011〈 此 处 是 二 进 制 数 ) 。MIPS32 架 构 中 有 32 个 通用 寄存 
器 ， 使 用 5 位 编码 就 可 以 全 部 表示 ， 所 以 rs、rt、rd 的 宽度 都 是 5 位 。sa 只 
有 在 移 位 指令 中 使 用 ， 用 来 指定 移 位 位 数 。 





(2) IR: 具体 操作 由 op 指定 ， 指 令 的 低 16 位 是 立即 数 ， 运 算 时 
要 将 其 扩展 至 32 位 ， 然 后 作为 其 中 一 个 源 操 作 数 参与 运算 。 


(3) J 类 型 : 具体 操作 由 op 指定 ， 一 般 是 跳 转 指令 ， 低 26 位 是 字 地 
址 ， 用 于 产生 跳 转 的 目标 地 址 。 
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在 “计算 机 的 简单 使 用 模型 ”中 已 经 介绍 过 ， 可 以 直接 使 用 0、1 编 码 
进行 程序 设计 ， 但 是 那样 显然 太 不 方便 、 容 易 出 错 ， 于 是 人 们 使 用 一 些 
助 记 符 来 表示 各 种 指令 ， 这 就 是 汇编 指令 ， 使 用 汇编 程序 将 汇编 指令 翻 
all 别 的 0、1 编 码 。 也 就 是 将 汇编 指令 翻译 为 图 1-5 所 示 
的 格式 ， 这 样 处 理 器 就 可 以 识别 了 。MIPS32 架 构 中 定义 的 指令 可 以 分 





为 以 下 几 类 。 注 意 : 其 中 不 包括 浮 点 指令 ， 因 为 本 书 实现 的 处 理 器 不 包 
含 序 点 处 理 单 元 ， 也 就 没有 实现 浮 点 指令 ， 所 以 此 处 不 介绍 浮 点 指令 。 





1. 逻辑 操作 指令 


有 8 条 指令 : and、andi、or、ori、xor、xori、nor、lui， 实 现 逻 辑 
与 、 或 、 异 或 、 或 非 等 运算 。 本 书 设计 的 处 理 器 实现 了 所 有 逻辑 操作 指 
令 ， 将 在 第 4、5 章 详细 介绍 各 个 逻辑 操作 指令 的 格式 、 作 用 、 用 法 ， 以 
及 实现 过 程 。 





2. 移 位 操作 指令 


有 6 条 指令 : sll, sllv, sra, srav, srl, srlvo KIZA A 
移 、 算 术 右 移 等 运算 。 本 书 设 计 的 处 理 器 实现 了 所 有 移 位 操作 指令 ， 将 
在 第 5 章 详 细 介 绍 各 个 移 位 操作 指令 的 格式 、 作 用 、 用 法 ， 以 及 实现 过 


程 。 





3. 移动 操作 指令 


有 6 条 指令 : movn、movz、mfhi、mthi、mflo、mtlo， 用 于 通用 寄 
存 器 之 间 的 数据 移动 ， 以 及 通用 寄存 器 与 H、LO 寄 存 器 之 间 的 数据 移 
动 。 本 书 设计 的 处 理 器 实现 了 所 有 移动 操作 指令 ， 将 在 第 6 草 详 细 介绍 
各 个 移动 操作 指令 的 格式 、 作 用 、 用 法 ， 以 及 实现 过 程 。 





4. 算术 操作 指令 


有 21 条 指令 : add, addi, addiu, addu, sub, subu, clo, clz, slt, 
slti, sltiu, situ, mul, mult, multu, madd. maddu, msub, msubu, 
div、divu， 实 现 了 加 法 、 减 法 、 比 较 、 乘 法 、 乘 累加 、 除 法 等 运算 。 本 
书 设计 的 处 理 堪 实现 了 所 有 算术 操作 指令 ， 将 在 第 7 章 详细 介绍 各 个 算 





术 操 作 指 令 的 格式 、 作 用 、 用 法 ， 以 及 实现 过 程 。 
5. 转移 指令 


有 14 条 指令 : jr, jal js jal. b, bal. beq, bgez, bgezal, bgtz. 
blez、bltz、bltzal、bne， 其 中 既 有 无 条 件 转移 ， 也 有 条 件 转移 ， 用 于 程 
序 转移 到 另 一 个 地 方 执行 。 本 书 设计 的 处 理 器 实现 了 所 有 转移 指令 ， 将 
在 第 8 章 详细 介绍 各 个 转移 指令 的 格式 、 作 用 、 用 法 ， 以 及 实现 过 程 。 


6. 加 载 存储 指令 


有 14 条 指令 : lb, lbu, lh, lhu, lẹ, Iw, Iwl lwr, sb, scs sh, 
sw、swl、swr， 以 “3? 开始 的 都 是 加 载 指令 ， 以 “s” 开 始 的 都 是 存储 指 
令 ， 这 些 指令 用 于 从 存储 器 中 读 取 数据 ， 或 者 回 存 储 器 中 保存 数据 。 本 
书 设 计 的 处 理 器 实现 了 所 有 加 载 存 储 指令 ， 将 在 第 9 章 详 细 介 绍 各 个 加 
载 存 储 指令 的 格式 、 人 作用、 用法， 以 及 实现 过 程 。 











7. 协 处 理 器 访问 指令 


有 2 条 指令 : mtc0、mfc0， 用 于 读 取 协 处 理 器 CP0 中 某 个 寄存 器 的 
值 ， 或 者 将 数据 保存 到 协 处 理 器 CP0 中 的 某 个 寄存 器 。 本 书 设计 的 处 理 
器 实现 了 所 有 协 处 理 器 访问 指令 ， 将 在 第 10 章 详细 介绍 协 处 理 器 、 协 处 
理 器 访问 指令 的 格式 、 人 作用、 用法， 以 及 实现 过 程 。 





有 14 条 指令 ， 其 中 有 12 条 上 自 陷 指 令 ， 包 括 : teq、tge、tgeu、tlt、 
ttu、tne、teqi、tgei、tgeiu、tlti、tltiu、tnei， 此 外 还 有 系统 调用 指令 
syscall、 腊 第 返 回 指令 eret。 本 书 设计 的 处 理 器 实现 了 所 有 腊 弟 相关 指 
令 ， 将 在 第 11 章 详细 介绍 异常 相关 指令 的 格式 、 作 用 、 用 法 ， 以 及 实现 


有 4 条 指令 : nop、ssnop、sync、pref， 其 中 nop 是 空 指 令 ，ssnop 是 


一 种 特殊 类 型 的 空 指令 ，sync 指 令 用 于 保证 加 载 、 存 储 操作 的 顺序 ， 
pref 指 令 用 于 缓存 预 取 。 本 书 设计 的 处 理 器 对 这 4 条 指令 进行 了 简化 并 加 
以 实现 ， 将 在 第 5 章 详 细 介 绍 简 化 后 的 实现 过 程 。 





1.4.6” 寻 址 方式 


MIPS32 架 构 的 寻 址 模式 有 寄存 器 寻 址 、 立 即 数 寻 址 、 寄 存 器 相对 
寻 址 和 PC 相对 寻 址 四 种 。 其 中 寄存 器 相对 寻 址 、PC 相 对 寻 址 的 介绍 如 
Ta 


C1) 寄存 器 相对 寻 址 


这 种 寻 址 模式 主要 是 加 载 /存储 指令 使 用 ， 其 将 一 个 16 位 的 立即 数 
做 符号 扩展 ， 然 后 与 指定 通用 寄存 器 的 值 相 加 ， 从 而 得 到 一 个 有 效 地 
址 ， 如 图 1-6 所 示 。 











16 位 立即 数 做 符号 扩展 





通用 寄存 器 GPR 





y 
x 


有 效 地 址 


图 1-6 寄存 器 相对 寻 址 
(2) PC 相对 寻 址 


这 种 寻 址 模式 主要 是 转移 指令 使 用 ， 在 转移 指令 中 有 一 个 16 位 的 立 
即 数 ， 将 其 左 移 两 位 并 作 符 号 扩展 ， 然 后 与 程序 计数 寄存 器 PC 的 值 相 
加 ， 从 而 获得 有 效 地 址 。 如 图 1-7 所 示 。 






































程序 计数 寄存 器 PC 16 位 立即 数 左 移 两 位 并 做 符号 扩展 
> + < 
T 
有 效 地 址 











图 1-7 PC 相对 寻 址 


1.4.7 协 处 理 器 CP0 





协 处 理 器 一 词 通 常用 来 表示 处 理 器 的 一 个 可 选 部 件 ， 负 责 处 理 指令 
集 的 某 个 扩展 ， 拥 有 与 处 理 器 相 独 立 的 寄存 器 。MIPS32 架 构 提 供 了 最 
多 4 个 协 处 理 器 ， 分 别 是 CP0 一 CP3。 协 处 理 器 CP0 用 作 系 统 控制 ， 

CP1、CP3 用 作 浮 点 处 理 单元 ， 而 CP2 被 保留 用 于 特定 实现 。 除 CP0 外 的 
协 处 理 器 都 是 可 选 的 。 





协 处 理 絮 CP0 的 具体 作用 有 : 配置 CPU 工作 状态 、 高 速 缓存 控制 、 
异常 控制 、 存 储 管理 单元 控制 等 。CP0 通 过 配置 内 部 的 一 系列 寄存 器 来 
完成 上 述 工 作 。 本 书 设计 的 处 理 器 实现 了 CP0 的 部 分 功能 ， 将 在 第 10 章 
详 述 。 





1.4.8 ”异常 


在 处 理 器 运行 过 程 中 ， 会 从 存储 器 中 依次 取出 指令 ， 然 后 执行 ， 但 
是 有 一 些 事件 会 打 断 正 第 的 程序 执行 流程 ， 这 些 事件 有 中 晰 
(Interrupt) 、 陷 阱 〈Trap) ~ RAWA (System Call) 等 ， 统 称 为 异 
第 。 异 种 发 生 后 ， 处 理 器 会 转移 到 一 个 事先 定义 好 的 地 址 ， 在 那个 地 址 
有 异常 处 理 例 程 ， 在 其 中 进行 异常 处 理 ， 这 个 地 址 称 为 异常 处 理 例 程 入 
口 地 址 。 异 常 处 理 完成 后 ， 使 用 异常 返回 指令 eret， 返 回 到 异常 发 生前 
的 状态 继续 执行 。 本 书 设 计 的 处 理 器 实现 了 对 人 硬件 复位 、 中 断 (包含 软 
Halt. WERE) 、syscall 系 统 调用 、 无 效 指令 、 湾 出 、 目 陷 6 种 异 贡 的 
处 理 ， 将 在 第 11 章 详 述 。 








15 本 书 的 目标 与 组 织 方式 


本 书 的 目标 是 实现 一 款 兼 容 MIPS32 指 令 集 架构 的 处 理 器 ， 命 名 为 
OpenMIPS， 该 处 理 器 是 通过 使 用 硬件 可 编程 语言 Verilog HDL 编写 代码 
实现 的 ， 编 号 后 的 代码 经 过 编译 可 以 下 载 到 FPGA 心 请 上 ， 组 成 实际 的 
人 硬件 电路 。 计 划 实 现 两 个 版 本 一 一 教学 版 OpenMIPS、 实 践 版 
OpenMIPS. 


教学 版 OpenMIPS 处 理 器 的 主要 设想 是 尽量 简单 ， 比 如 ， 在 一 个 时 
钟 周期 内 可 以 取 到 指令 ， 完 成 存储 、 加 载 数据 ， 这 样 处 理 器 的 运行 情况 
(主要 是 流水 线 的 运行 ) 就 比较 理想 化 ， 与 教科 书 相似 ， 代 码 也 很 清晰 
简单 ， 便 于 使 用 其 进行 教学 、 学 术 研究 和 讨论 ， 也 有 助 于 学 生理 解 课堂 
上 讲授 的 知识 。 


实践 版 OpenMIPS 处 理 器 的 设计 目标 是 在 教学 版 OpenMIPS 的 基础 上 
实现 Wishbone 总 线 接口 ， 这 样 就 能 将 其 挂 接 在 Wishbone 总 线 上 ， 从 而 可 
以 使 用 大 量 开源 的 SDRAM、Flash、GPIO、UART、LCD 等 模块 的 控制 
器 ， 组 成 一 个 SOPC (System-On-a-Programmable-Chip， 可 编程 片上 系 
统 ) ， 完 成 特定 功能 ， 成 为 一 个 能 发 挥 实际 作用 的 处 理 器 。 


全 书 组 织 如 下 。 


为 了 方便 读者 理解 ， 在 第 2 章 将 对 FPGA、Verilog HDL 的 基础 知识 
做 一 介绍 。 


第 3 章 介 绍 教学 版 OpenMIPS 处 理 器 的 设计 蓝图 ， 包 括 设计 目标 、 处 
理 器 接口 ， 以 及 最 终 完 成 时 ， 组 成 OpenMIPS 的 各 个 模块 的 作用 ， 力 图 


使 读者 有 一 个 整体 认识 。 并 在 本 章 详 述 了 OpenMIPS 处 理 器 的 实现 方 
TE 


随后 的 第 4 一 11 昔 ， 从 最 简单 的 情况 开始 ， 通 过 依次 添加 实现 逻辑 
操作 指令 、 移 位 操作 指令 、 空 指令 、 移 动 操作 指令 、 算 术 操 作 指 令 、 转 
移 指 令 、 加 载 存储 指令 、 协 处 理 吉 访问 指令 、 异 常 相关 指令 ， 了 基 终 实现 
教学 版 OpenMIPS 处 理 需 。 在 每 一 类 指令 的 实现 过 程 中 ， 都 是 先 介绍 该 
类 指令 的 格式 、 作 用 、 用 法 ， 然 后 介绍 实现 思路 ， 接 着 通过 修改 代码 实 
现 该 类 指令 ， 最 后 ， 编 写 测 试 程序 ， 使 用 仿真 的 方式 验证 是 否 正 确实 
现 。 














第 12 章 实现 了 实践 版 OpenMIPS 人 处理 器 。 


第 13 章 设计 实现 了 基于 实践 版 OpenMIPS 的 小 型 SOPC， 该 SOPC 包 
括 OpenMIPS 处 理 器 、SDRAM 控 制 器 、UART 控 制 嚣 、Flash 控 制 器 、 
GPIO 模 块 、 总 线 单元 。 





第 14 章 将 第 13 章 实现 的 小 型 SOPC 下 载 到 实际 的 硬件 平台 上 ， 编 写 
测试 程序 ， 验 证 实践 版 OpenMIPS 是 否 正确 实现 。 


第 15 章 介绍 人 区 入 式 实时 操作 系统 hC/OS-I， 并 将 其 移植 到 本 书 设计 
的 OpenMIPS 处 理 器 上 ， 进 一 步 验证 了 实践 版 OpenMIPS 处 理 器 实现 的 正 
确 性 ， 也 为 OpenMIPS 处 理 喜 发 挥 实际 作用 芮 定 了 基础 。 


第 2 草 "可 编程 逻辑 器 件 与 Ver i log 
HDL 


通过 第 1 章 的 介绍 ， 读 者 应 该 知道 CPU 内 部 有 一 些 基本 的 电路 ， 比 
如 : 译 码 电路 、 运 算 电 路 、 控 制 电 路 ， 此 外 还 有 一 些 寄存 器 等 。 这 些 电 
路 怎么 实现 呢 ? 当然 可 以 通过 一 大 堆 分 立 的 元 器 件 实现 ， 实 际 上 在 2008 
年 ， 美 国 加 州 的 游戏 开发 人 士 Steve ”Chamberlin 就 自己 制造 了 一 款 8 位 
CPU， 耗 时 18 个 月 ， 论 费 1000 美 元 ， 总 共 使 用 了 1253 条 线 绕 ， 如 图 2-1 
所 示 ，Steve Chamberlin 为 它 起 了 一 个 十 分 贴切 的 名 字 一 一 BMOW (Big 
Mess of Wires) 。 





图 2-1 BMOWH Am (4) 与 正面 


还 有 一 位 叫 Bil Buzbee 的 朋友 也 用 200 多 块 74 系 列 的 TITL 和 集成 电路 纯 
手工 制造 了 一 款 CPU。 


上 述 事 件 只 是 证 明了 使 用 分 立 元 件 实 现 CPU 的 可 行 性 ， 但 那 并 不 是 
实现 CPU 的 好 方法 ， 本 书 是 通过 “代码 +FPGA2” 的 方式 实现 CPU 的 ， 本 章 
将 对 其 原理 进行 解释 ， 并 对 使 用 的 编程 语言 Verilog HDL 进行 介绍 。 


2.1 


EA a PL IS 


FPGA 是 可 编程 还 辑 器 件 〈Programmable Logic Device, PLD) 的 一 
种 。PLD 是 上 世纪 70 年 代 发 展 起 来 的 一 种 新 型 器 件 ， 它 的 应 用 和 发展 不 
仅 简 化 了 电路 设计 ， 降 低 了 开发 成 本 ， 提 高 了 系统 可 靠 性 ， 而 且 给 数字 
系统 的 设计 方法 市 来 了 半 命 性 的 变化 。 截 止 到 现在 ， 出 现 了 多 种 工艺 、 
不 同 原理 的 PLD， 如 下 。 


PLA (Programmable Logic Array) 可 编程 逻辑 阵列 

PAL (Programmable Array Logic) 可 编程 阵列 逻辑 

GAL (Generic Array Logic) 通用 阵列 逻辑 

PROM (Programmable Read-Only Memory) 可 编程 只 读 存 储 器 
EPLD (Erasable Programmable Logic Device) 可 的 除 可 编程 逻 
辑 器 件 

CPLD (Complex Programmable Logic Device) 复杂 可 编程 逻辑 
器 件 

FPGA (Field Programmable Gate Array) 现场 可 编程 门 阵列 











按照 不 同 的 内 部 络 构 可 以 将 PLD 器 件 分 为 如 下 两 类 。 


1. 基于 乘积 项 (Product-Term) 结构 的 PLD 器 件 


任何 组 合 逻 辑 电 路 函数 均 可 化 为 “与 或 "表达 式 ， 用 “与 门 - 或 门 ”两 级 
电路 实现 ， 而 任何 时 序 电路 又 都 可 以 由 组 合 电路 加 上 存储 元 件 〈 触 发 
at) 构成 。 因 此 ， 从 原理 上 说 ， 与 或 阵列 加 上 触发 器 的 络 构 就 可 以 实现 
任意 的 数字 逻辑 电路 。 基 于 乘积 项 结构 的 PLD 需 件 的 主要 结构 束 是 与 或 








阵列 ， 通 过 灵活 配置 的 互 连 线 ， 实 现任 意 逻 辑 功能 。 其 基本 结构 如 网 2- 
QATAR o 
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图 2-2 ”基于 乘积 项 结构 的 PLD 器 件 结 构图 





基于 乘积 项 结构 的 PLD 器 件 由 输入 绥 冲 电路 、 与 阵列 、 或 阵列 和 输 
出 缓冲 电路 四 部 分 组 成 。“ 与 阵列 ”和 “或 阵列 ”是 主体 ， 主 要 用 来 实现 各 
种 逻辑 函数 和 风 辑 功能 ， 输 入 缓冲 电路 用 于 产生 输入 信号 的 原 变 量 和 反 
变量 ， 并 增强 输入 信号 的 驱动 能 力 ;， 输出 缓冲 电路 主要 用 来 对 将 要 输出 
的 信号 进行 处 理 ， 既 能 输出 纯 组 合 馆 辑 信 号 ， 也 能 输出 时 序 罗 辑 信和 号。 








PROM、PLA、PAL、GAL、EPLD 和 绝 大 部 分 CPLD 器 件 都 是 采用 
乘积 项 (Product-Term) 结构 的 PLD， 内 部 基于 与 或 阵列 逻辑 ， 这 类 器 
件 多 采用 EEPROM 或 Flash 工 亏 制作 ， 抒 电 后 不 会 丢失 配置 数据 ， 器 件 
规模 一 般 小 于 5000 门 。 


2. 基于 查找 表 (Look-Up Table, LUT) 结构 的 PLD 器 件 











基于 与 或 阵列 的 PLD 器 件 的 规模 不 容易 做 得 很 大 ， 于 是 设计 人 员 又 
开发 出 另外 一 种 可 编程 逻辑 器 件 ， 即 查找 表 结 构 。 其 原理 类 似 于 
ROM， 物 理 结构 基于 静态 存储 器 (MStaticRAM, SRA) 和 数据 选择 器 
(MUX) ， 通 过 查 表 方式 实现 函数 功能 。 函 数值 放 在 SRAM 中 ，SRAM 
的 地 址 线 即 输入 变量 ， 不 同 的 输入 通过 MUX 找 到 对 应 的 函数 值 并 输 
出 。N 个 输入 项 的 逻辑 函数 可 以 由 一 个 2 位 容量 的 SRAM 实 现 。 


图 2-3 是 用 2 输入 查找 表 实 现 2 输 入 或 门 的 示意 图 。2 输 入 查找 表 中 有 
4 个 存储 单元 ， 用 来 存储 真 值 表 中 的 4 个 值 ， 输 入 变量 A、B 作 为 查找 表 
中 3 个 多 路 选择 器 的 地 址 选择 端 ， 根 据 A、B 值 的 组 合 从 4 个 存储 单元 中 
选择 一 个 作为 查找 表 的 输出 ， 即 实现 了 2 输入 或 门 的 逻辑 功能 。 





查找 表 结构 的 功能 非常 强 ，N 个 输入 的 查找 表 可 以 实现 任意 N 个 输 
入 变量 的 组 合 逻 辑 函 数 。 从 理论 上 讲 ， 只 要 能 够 增加 输入 信和 号 线 和 扩大 
存储 器 容量 ， 用 查找 表 就 可 以 实现 任意 输入 变量 的 函数 。 但 在 实际 应 用 
中 ， 查 找 表 的 规模 受 技 术 和 成 本 因素 的 限制 。 每 增加 一 个 输入 变量 ， 查 
找 表 SRAM 的 容量 就 要 扩大 一 倍 ，SRAM 的 容量 与 输入 变量 数 N 的 关系 
是 2N 倍 。8 输 入 变量 的 查找 表 需 要 256b 容 量 的 SRAM， 而 16 个 输入 变量 
的 查找 表 则 需要 64Kb 容 量 的 SRAM， 这 个 规模 已 无 法 忍受 。 实 际 上 ， 
FPGA 器 件 查 找 表 的 输入 变量 一 般 不 超过 5 个 ， 多 于 5 个 输入 变量 的 逻辑 
函数 可 由 多 个 查找 表 通 过 组 合 或 级 联 实现 。 







































































2 输入 或 门 真 值 表 
A B F E u g 
0 0 0 "u N | 
0 1 l A || | 
1 0 1 1 | 
1 1 1 A 
B 


图 2-3 ”用 2 输入 查找 表 实 现 或 门 功能 


绝 大 多 数 FPGA 器 件 都 是 基于 SRAM 查 找 表 结构 实现 的 。 特 点 是 集 
成 度 高 “可 实现 百 万 逻辑 门 以 上 设计 规模 ) 、 逻 辑 功能 强 ， 可 实现 大 规 
模 的 数字 系统 设计 和 复杂 的 算法 运算 ,但 掉 电 后 会 丢失 配置 数据 ， 需 外 
挂 非 易 失 配置 器 件 以 存储 配置 数据 ， 才 能 构成 可 独立 运行 的 系统 。 在 











FPGA 内 部 一 般 还 会 集成 更 多 的 逻辑 功能 块 ， 如 存储 器 块 、DSP 块 、 硬 
件 乘 法 器 、 数 字 锁 相 环 等 ， 用 以 满足 数字 信和 号 处 理 、 数 字 通 信 等 应 用 的 


== 
需要 。 


本 书 最 终 实现 的 实践 版 OpenMIPS 处 理 器 就 将 下 载 到 FPGA 上 运行 ， 
使 用 的 是 Altera 公 司 的 EP2C35 系 列 的 FPGA， 其 具有 33216 个 LE (Logic 
Element) ， 每 个 LE 主要 由 一 个 4 输入 查找 表 和 一 个 可 编程 的 寄存 器 构 
成 。 


2.2 ”基于 PLD 的 数字 系统 设计 流程 


PLD 不 仅 是 技术 的 革新 ， 也 带 来 观念 的 革新 、 设 计 流 程 的 革新 ， 基 
于 PLD 的 数字 系统 设计 流程 如 图 2-4 所 示 。 本 节 将 分 别 介绍 流程 中 的 各 
个 阶段 。 





设计 输入 
(原理 图 、HDL 文 本 ) 
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oor A 


ar 
IN 


(逻辑 综合 、 优 化 ) 


PLD 布 线 / 适 配 
(自动 优化 、 布 局 、 布 线 / 
适 配 ) 


oy 


PLD 编程 下 载 EN 在 线 测 试 





















































图 2-4 基于 PLD 的 数字 系统 设计 流程 
yu y -人 、 
2.2.1 WA 


设计 和 输入 是 将 设计 者 所 设计 的 电路 以 开发 软件 要 求 的 茶 种 形式 表达 
出 来 ， 并 输入 到 相应 软件 中 的 过 程 。 设 计 输 入 有 多 种 方式 ， 最 常用 的 是 


原理 图 方式 和 HDL 文本 方式 两 种 。 
1. 原理 图 输入 


原理 图 (Schematic) 是 图 形 化 的 表达 方式 ， 使 用 元 件 符号 和 连 线 来 
描述 设计 。 原 理 图 输入 对 用 户 来 说 很 百 观 ， 尤 其 对 于 表现 层次 结构 、 模 
块 化 结构 更 为 方便 ， 适 合 描述 连接 关系 和 接口 关系 ， 而 描述 逻辑 功能 则 
比较 烦琐 。 其 要 求 设 计 工 具 提 供 必要 的 元 件 库 或 巡 辑 宏 单 元 。 如 果 输 入 
的 是 较为 复杂 的 逻辑 或 者 元 件 库 中 不 存在 的 模型 ， 采 用 原理 图 输入 的 方 
式 往 往 很 不 方便 ， 此 外 ， 原 理 图 方式 的 设计 可 重用 性 、 可 移植 性 也 差 一 


些 。 





图 2-5 是 使 用 原理 图 输入 的 二 选 一 选择 器 的 电路 。 有 三 个 输入 : 
a0、al、s， 一 个 输出 y， 当 s$ 为 1 时 ，y 的 值 等 于 al 的 值 ， 当 s 为 0 时 ，y 的 
值 等 于 a0 的 值 。 





OR 


Due 
AND 
图 2-5 ”二 选 一 选择 器 


2. HDL 文 本 输入 


硬件 描述 语言 (Hardware Description Language, HDL) 是 一 种 用 文 
本 形式 来 描述 和 设计 电路 的 语言 。 设 计 者 可 利用 HDL 语言 来 描述 自己 的 
设计 ， 然 后 利用 相应 的 工具 进行 综合 ， 变 为 某 种 目标 文件 ， 最 后 下 载 到 
PLD 器 件 ， 实 现 具 体 电路 。 目 前 常用 的 HDL 有 VHDL、YVerilog HDL 等 。 





VHDL 和 Verilog HDL 各 有 优点 ， 可 以 进行 算法 级 (Algorithm 
Levels) 、 寄 存 器 传输 级 (RTL) 、 门 级 (Gate Levels) 等 各 种 层次 的 
逻辑 设计 ， 也 可 以 进行 仿真 验证 、 时 序 分 析 等 。 由 于 HDL 语言 的 标准 
化 ， 易 于 将 设计 移植 到 不 同 广 家 的 必 片 中 ， 信 和 号 参数 也 容易 改变 和 修 
改 。 此 外 ， 采 用 HDL 进行 设计 还 具有 工 亏 无 关 性 ， 使 得 设计 人 员 在 功能 
设计 、 有 还 辑 验 证 阶段 可 以 不 必 过 多 考虑 门 级 及 工艺 实现 的 具体 细节 ， 只 
需 根 据 系 统 设 计 的 要 求 ， 施 加 不 同 的 约束 条 件 ， 即 可 设计 出 实际 的 电 
路 。 如 下 是 使 用 Verilog HDL 实现 的 二 选 一 选择 器 的 代码 。 


module mux2(a0, al, S, y); 
input s, a0, al; 
output y; 
assign y=s ? al:a0; 


endmodule 


本 书 使 用 Verilog HDL E 3 LOpenMIPS Xb FEKE - 


2.2.2 24 


Sx (Synthesis) 是 将 较 高 级 抽象 层次 的 设计 描述 自动 转化 为 较 低 
层次 描述 的 过 程 。 有 以 下 几 种 综合 形式 。 


。 将 算法 表示 、 行 为 描述 转换 到 寄存 器 传输 级 〈RITL) ， 即 从 行 
为 描述 到 结构 描述 。 

。 将 RIL 级 措 述 转换 到 逻辑 门 级 ， 称 为 逻辑 综合 。 

。 将 逻辑 门 表示 转换 到 PLD 器 件 的 配置 网 表 表 示 ， 有 了 配置 网 表 
就 可 完成 基于 PLD 器 件 的 系统 实现 。 





综合 器 束 是 能 够 自动 实现 上 述 转换 的 软件 工具 ， 其 能 够 将 原理 图 或 
HDL 语言 表达 、 描 述 的 电路 编 详 成 由 与 或 阵列 、RAM、 触 发 项、 寄存 
器 等 逻辑 单元 组 成 的 电路 网 表 。 


2.2.3 布局 布线 


布局 布线 可 以 理解 为 将 综合 生成 的 电路 网 表 映 财 到 具体 的 目标 PLD 
器 件 ， 并 产生 了 最 终 可 下 载 文件 的 过 程 。 布 局 布线 将 综合 后 的 电路 网 表 针 
对 茶 一 共 体 的 目标 PLD 噩 件 进行 逻辑 映射 ， 把 整个 设计 分 为 多 个 适合 
PLD 霹 件 彤 部 逻辑 资源 实现 的 逻辑 小 块 ， 并 根据 用 户 的 设 定 在 速度 和 面 
积 之 间 做 出 选择 或 折 中 。 其 中 布局 是 将 已 分 割 的 逻辑 小 块 放 到 PLD 器 件 
内 部 逻辑 资源 的 具体 位 置 ， 并 使 它们 易于 连 线 ; 布线 则 是 利用 PLD 咒 件 
的 布线 资源 完成 各 功能 块 之 间 、 反 馈 信 和 号 之 间 的 连接 。 











布局 布线 完成 后 产生 如 下 一 些 重要 的 文件 。 
C1) 必 片 资源 耗 用 的 情况 报告 。 


(2) 产生 延 时 网 表 结 构 ， 以 便于 进行 精确 的 时 序 仿真 ， 能 比较 精 
确 地 预测 未 来 必 片 的 实际 性 能 。 


(3) 器 件 编程 文件 ， 如 用 于 CPLD 编程 的 了 DEC、POF 等 格式 的 文 
件 ， 用 于 FPGA 配 置 的 SOF、JAM、BIT 等 格式 的 文件 。 


2.2.4 F 


把 布局 布线 过 程 中 产生 的 器 件 编程 文件 放 入 PLD 的 过 程 称 为 下 载 。 





通常 将 对 CPLD 器 件 的 下 载 称 为 编程 ， 将 对 FPGA 器 件 的 下 载 称 为 配置 
(Configuration) 。 下 载 后 ，PLD 内 部 的 与 或 门 〈 对 FPGA 而 言 就 是 查找 
K) 会 按照 编程 文件 的 要 求 变化 ， 从 而 实现 了 设计 的 电路 。 


2.25 ”仿真 


从 图 2-4 中 可 发 现 其 中 有 仿真 环节 。 仿 真 (Simulation) 也 称 为 模 
拟 ， 是 对 所 设计 电路 的 功能 进行 检验 。 用 户 可 以 在 设计 过 程 中 对 整个 系 
统 和 各 个 模块 进行 仿真 ， 即 在 计算 机 上 用 软件 验证 功能 是 否 正 确 ， 各 部 
分 的 时 序 配合 是 否 准确 。 如 果 有 问题 可 以 随时 进行 修改 ， 从 而 避免 了 逻 
辑 错误 。 规 模 越 大 的 设计 ， 越 需要 进行 仿真 。 





仿真 包括 功能 仿真 和 时 序 仿真 。 不 考 碟 信号 时 延 等 因 和 又 的 仿真 ， 称 
为 功能 仿真 ， 又 叫 前 仿真 ;时 序 仿 真 义 称 后 仿真 ， 它 是 在 选择 具体 器 件 
并 完成 布局 布线 后 进行 的 包含 时 延 的 仿真 。 由 于 不 同 嚣 件 的 内 部 时 延 不 
一 样 ， 不 同 的 布局 、 布 线 方案 也 会 影响 时 延 ， 因 此 在 设计 实现 中 ， 对 网 
络 和 逻辑 块 进行 时 序 仿真 ， 分 析 定 时 关系 ， 估 计 设 计 性 能 是 非常 必要 
的 。 





本 书 实现 的 教学 版 OpenMIPS 处 理 器 就 是 主要 通过 仿真 来 验证 其 实 
现 是 否 正确 ， 只 有 实践 版 OpenMIPS 才 配置 到 具体 的 FPGA 芯 片 中 。 


226 工具 介绍 





在 基于 PLD 的 数字 系统 设计 流程 的 每 一 个 阶段 都 有 相应 的 工具 文 
持 ， 有 些 工具 是 集成 的 ， 可 以 完成 整个 设计 流程 的 各 个 阶段 ， 有 些 工具 








是 专门 针对 某 一 设计 阶段 的 。 本 书 在 设计 实现 OpenMIPS 处 理 器 时 使 用 
的 工具 如 下 。 


e 设计 输入 工具 : UltraEdit 
e 仿真 工具 : ModelSim 
e 集成 工具 : QuartusII 


因为 实践 版 OpenMIPS 是 下 载 到 Altera 公 司 的 FPGA 芯 片 中 ， 所 以 集 
成 工具 使 用 的 是 Altera 公 司 的 QuartusII。 一 般 而 言 ， 集 成 工具 最 好 选择 
目标 PLD 心 片 广 商 提 供 的 工具 ， 因 为 厂商 的 工具 会 针对 自己 器 件 的 工艺 
特点 做 优化 设计 ， 从 而 提高 资源 利用 率 、 降 低 功 耗 、 改 善 性 能 。 











2.3 Verilog HDE 人 简介 


本 书 实现 的 OpenMIPS 处 理 器 是 使 用 Verilog HDL 编写 的 ， 所 以 本 章 
接 下 来 的 几 节 将 介绍 Verilog ”HDL 的 一 些 基本 知识 ， 包 括 语法 、 结 构 
等 。 因 为 本 书 并 不 是 一 本 讲授 Verilog HDL 的 专门 书籍 ， 所 以 此 处 介绍 
的 内 容 并 不 是 Verilog HDL 的 全 部 ， 只 是 一 些 基 础 知识 ， 以 及 在 
OpenMIPS 处 理 器 实现 过 程 中 会 使 用 到 的 知识 。 读 者 如 果 对 Verilog HDL 
有 进一步 了 解 的 需求 ， 可 以 参考 相关 书籍 ， 这 方面 有 许多 非常 优秀 的 书 
籍 。 笔 者 推荐 《数字 系统 设计 与 Verilog HDL (第 4 版 ) 》， 本 章 关 于 
Verilog HDL 的 介绍 也 部 分 参考 了 该 书 。 








Verilog HDL 由 GDA (Gateway Design Automation) 公司 的 Phil 
Moorby 于 1983 年 首创 ， 之 后 ，Moorby 又 设计 了 Verilog-XL 仿 真 器 ， 
Verilog-XL 仿 真 器 的 大 获 成 功 ， 也 使 得 Verilog HDL 得 到 了 推广 使 用 。 
1989 年 ，Cadence 收 购 了 GDA，1990 年 ，Cadence 公 开发 布 了 Verilog 
HDL, KL OVI (Open Verilog International) 组 织 ， 专 门 负责 
Verilog HDL 的 发 展 。 由 于 Verilog HDL 具有 简洁 、 高 效 、 易 用 、 功 能 强 
等 优点 ， 已 逐渐 为 众多 设计 者 所 接受 和 喜爱 ， 其 友 展 经 历 了 几 个 关键 节 
Ele 


e 19954F, Verilog HDL 成 为 IEEE 标 准 ， 称 为 IEEE Standard 1364- 
1995 (Verilog-1995) 。 

e 20014F, IEEE Standard 1364-2001 (Verilog-2001) 获得 通过 ， 
其 对 Verilog-1995 做 了 扩充 和 增强 。 男 外 ， 修 改 了 一 些 语法 结 
构 ， 使 之 更 易于 使 用 。 

。 2002 年 ， 为 了 使 综合 器 输出 的 结果 和 基于 IEEE Standard 1364- 


2001 的 仿真 和 分 析 工 具 的 结果 相 一 致 ， 推 出 了 IEEE 1364[1].1- 
2002 标 准 ， 其 对 Verilog HDL 的 RTL 级 综合 定义 了 一 系列 的 建 
模 准 则 。 

。 2005 年 ，Verilog HDL 再 次 进行 了 更 新 ， 即 IEEE Standard 1364- 
2005 (Verilog-2005) 。 该 版 本 只 是 对 上 一 版 本 的 细微 修正 。 
这 个 版 本 还 包括 了 一 个 相对 独立 的 新 部 分 ， 即 Verilog-AMS 

(Analog and Mixed-Signal) ， 这 个 扩展 使 得 传统 的 Verilog 
HDL 可 以 对 集成 模拟 和 混合 信号 的 系统 进行 建 模 。 





Verilog HDL 具有 下 述 特点 。 





(1) Verilog HDL 是 在 C 语 言 的 基础 上 发 展 而 来 的 ， 就 语法 结构 而 
，Verilog HDL 继 承 了 C 语 言 的 很 多 语法 结构 ， 两 者 有 许多 相似 之 处 。 





HI 


(2) 既 适 于 可 综合 的 电路 设计 ， 也 可 胜任 电路 与 系统 的 仿真 。 


(3) 能 在 多 个 层次 上 对 所 设计 的 系统 加 以 描述 ， 从 开关 级 、 门 
级 、 寄 存 堪 传输 级 (RTL) 到 行为 级 ， 都 可 以 胜任 ， 同 时 Verilog HDL 
不 对 设计 规模 施加 任何 限制 。 

(4) 灵活 多 样 的 电路 描述 风格 ， 可 进行 行为 描述 ， 也 可 进行 结构 
描述 ;支持 混合 建 模 ， 一 个 设计 中 的 各 个 模块 可 以 在 不 同 的 设计 层次 上 
建 模 和 描述 。 





(5) 内 置 多 种 基本 逻辑 门 ， 如 and、or 和 nand 等 ， 可 方便 地 进行 门 
级 结构 描述 ; 内置 多 种 开关 级 元 件 ， 如 pmos、nmos 和 cmos 等 ， 可 进行 
开关 级 的 建 模 。 


(6) 用 户 定义 原 语 (UDP) 创建 的 灵活 性 。 用 户 定 义 的 原 语 既 可 


以 是 组 合 逻 辑 ， 也 可 以 是 时 序 逻 辑 ， 通 过 编程 语言 接口 (PLI)〉 机 制 可 
进一步 扩展 Verilog HDL 语 言 的 描述 能 力 。 


2.4 Verilog HDL 中 模块 的 结构 


Verilog 程 序 的 基本 设计 单元 是 “模块 ”(Module) ， 一 个 模块 有 其 特 
定 的 结构 ， 如 图 2-6 所 示 。Verilog 的 模块 完全 定义 在 module 与 endmodule 
关键 字 之 间 ， 每 个 模块 包括 四 个 主要 部 分 : 模块 声明 、 端 口 定 义 、 数 据 
类 型 说 明和 逻辑 功能 描述 。 





module < 模块 名 > ( 
= Yi HO > H- = 
< 端口 > 模块 声明 
) ; 
ži O JE SC 
数据 类 型 说 明 
< 逻辑 功能 描述 > 
endmodule 








图 2-6 Module 的 基本 结构 


如 下 是 一 个 实现 32 位 加 法 器 的 模块 。 有 两 个 输入 信号 in1、in2， 两 
者 相 加 的 结果 通过 out 输 出 。 





下 面 结合 该 加 法 器 的 例子 ， 对 Module 的 基本 结构 进行 说 明 。 
1. 模块 声明 


模块 声明 包括 模块 名 字 ， 以 及 输入 、 输 出 端口 列表 ， 其 格式 如 下 。 


2. 端口 定义 
明确 说 明 模块 端口 的 方向 〈 输 入、 输出 、 双 疝 等 ) ， 其 格式 如 下 。 





3. 数据 类 型 说 明 


对 模块 中 所 有 用 到 的 信号 (包括 端口 信号 、 节 点 信号 等 ) 都 必须 进 


行 数据 类 型 的 定义 。Verilog HDL 提供 了 各 种 信号 类 型 ， 下 面 是 几 种 定 
义 信号 类 型 的 例子 。 各 数据 类 型 的 具体 含义 将 在 2.5.2 节 详 述 。 





对 于 端口 ， 可 以 将 数据 类 型 说 明 与 端口 定义 放 在 一 条 语句 中 完成 ， 
于 是 ， 上 文 的 32 位 加 法 器 可 以 改 为 如 下 形式 。 





对 于 端口 ， 还 可 以 将 端口 定义 、 数 据 类 型 说 明 都 放 在 模块 声明 中 ， 
而 不 再 放 在 模块 内 部 ， 于 是 ， 上 文 的 32 位 加 法 器 还 可 以 改 为 如 下 形式 ， 
更 为 简便 。 





endmodule 
4. 逻辑 功能 描述 


模块 中 最 核心 的 部 分 就 是 逻辑 功能 描述 ， 可 以 有 多 种 方法 在 模块 中 
描述 和 定义 逻辑 功能 。 几 种 基本 方法 如 下 ， 具 体内 容 将 在 2.6 市 详 述 。 
。 用 assign 持 续 赋值 语句 定义 


e 用 always 过 程 块 定义 
。 调用 元 件 〈 也 称 为 元 件 例 化 ) 


2.5 Verilog HDL 基本 要 素 


2.5.1 常量 


Verilog 中 的 第 量 (Constant) 有 三 种 : 整数 、 实 数 、 字 符 串 。 在 
OpenMIPS 的 实现 过 程 中 只 使 用 了 整数 常量 ， 所 以 ， 此 处 也 仪 介绍 整数 
常量 。 其 格式 如 图 2-7 所 示 。 





< 位 宽 > ' < 进 制 > ”< 数字 > 
ae — | Lera 


单 引号 指定 数值 的 进 制 
h 或 H: 十 六 进 制 。 d 或 D; 十 进 制 


0 或 0: ”八进制 ”b 或 B: 二 进 制 
图 2-7 整数 常量 的 格式 





一 些 整 数 常 数 的 例子 如 下 。 


8'b11000101 // 宽度 为 8 位 的 三 进 制 数 ， 数 值 为 11000101， 等 于 十 进 制 的 18 
8'h8a // 宽度 为 8 位 的 十 六 进 制 数 ， 数 值 为 8a， 等 于 十 进 制 的 138 
5'027 // 宽度 为 5 位 的 八进制 数 ， 数 值 为 27， 等 于 十 进 制 的 23 
4'd10 // 宽度 为 4 位 的 十 进 制 数 ， 数 值 为 19 


如 宁 没 有 明确 指明 进 制 ， 那 么 默认 是 十 进 制 数 。 


2.5.2 ”变量 声明 与 数据 类 型 


Verilog 中 变量 声明 的 格式 如 图 2-8 所 示 。 只 有 数据 类 型 、 变 量 名 是 
必要 的 ， 其 他 部 分 都 可 以 省 略 。 如 宋 省 略 符 号 和 位 宽 ， 那 么 根据 数据 类 
型 设置 为 默认 值 。 如 果 和 省略 元 系数 ， 那 么 默认 声明 元 系数 为 1。 


< 数据 类 型 > < 符号 > < 位 宽 > < 变量 名 > ”< 元 素数 > 
指定 变量 类 型 ， 可 以 A i 定义 数据 的 元 素数 ， 
为 variable 或 net 弄 本 部 分 可 省 略 
数据 的 变量 名 


指定 符号 ， 可 以 为 signed 或 
unsigned， 本 部 分 可 省 略 





定义 数据 的 位 宽 ， 本 部 分 可 省 由 


IX 





图 2-8 变量 声明 的 格式 
数据 类 型 可 以 是 net 型 、variable 型 ， 分 别 介绍 如 下 。 
1. net 型 变量 


net 型 相当 于 硬件 电路 中 各 种 物理 连接 ， 其 特点 是 输出 的 值 紧 跟 输 
入 值 的 变化 而 变化 。net 型 变量 包括 多 种 类 型 ， 如 表 2-1 所 示 。 


表 2-1 net 型 变量 





po | 地 或 接 电 源 


出 


supply1 | 1 位 无 符号 的 连接 


本 书 在 实现 OpenMIPS 处 理 器 的 时 候 只 使 用 了 其 中 的 wire 类 型 。wire 
是 最 和 常用 的 net 型 变量 ，Verilog HDL 模块 中 的 输入 、 输 出 信号 在 没有 明 
确 指定 数据 类 型 时 ， 都 被 默认 为 wire 型 。wire 型 信号 可 以 用 作 任何 表 达 
式 的 输入 ， 也 可 以 用 作 assign 语 句 和 实例 元 件 的 输出 ， 如 前 文中 的 32 位 
加 法 器 对 out 信 号 的 赋值 。 对 于 综合 器 而 言 ，wire 型 变量 的 取 值 可 为 0、 
1、X、Z， 其 中 0 表示 低 电 平 、 人 逻辑 0; 1 表示 高 电 平 、 人 效 辑 1; XX 表示 不 
确定 或 未 知 的 逻辑 状态 ，Z 表 示 高 阻 态 。 如 果 没 有 赋值 ， 默 认为 高 阻 态 
Lo 








2. variable! = 


variable 型 变量 是 可 以 保存 上 次 写 入 数据 的 数据 类 型 ， 一 般 对 应 硬 
件 上 的 一 个 触发 器 或 锁 存 器 等 存储 元 件 ， 但 并 不 是 绝对 的 ， 在 综合 器 综 
合 的 时 候 ， 会 根据 其 被 赋值 的 情况 来 具体 确定 是 映射 成 连 线 还 是 映射 为 
存储 元 件 。variable 型 变量 也 包括 多 种 类 型 ， 如 表 2-2 所 示 。 本 书 在 实现 
OpenMIPS 处 理 器 的 时 候 只 使 用 了 其 中 的 reg 类 型 








%2-2 variable 型 变量 


BRU A TE 默认 符号 含义 





variable 型 变量 必须 在 过 程 语句 (initial 或 always ) 中 实现 赋值 ， 这 
种 赋值 方式 称 为 过 程 赋值 ， 将 在 2.6 节 详 述 。 


253 [Ale 





图 2-8 变 量 声明 格式 中 的 位 宽 如 果 为 1， 那 么 对 应 的 变量 为 标量 ， 如 
果 不 为 1， 那 么 对 应 的 变量 为 同 量 ， 黑 认为 标量 。 回 量 的 位 宽 用 下 面 的 
形式 定义 。 














[MSB : LSB] 











冒号 左边 的 数字 表示 向 量 的 最 高 有 效 位 MSB (Most Significant 
Bit) ， 冒 号 右边 的 数字 表示 癌 量 的 最 低 有 效 位 LSB (Least Significant 
Bit) 。 例 如 。 














wire [3:0] bus; // 4 位 的 wire 型 向 量 bus， 其 中 bus[3] 是 最 高 位 ，bus[0. 
reg [31:5] ra; // 27 位 的 reg 型 癌 量 ra， 其 中 ra[31] 是 最 高 位 ，ra[5] 是 
reg [0:7] rc; // 8 位 的 reg 型 向 量 rc， 其 中 rc[0] 是 最 高 位 ，rc[7] 是 最 




















器 量 有 两 种 ， 一 种 是 癌 量 类 疝 量 ， 男 一 种 是 标量 类 疝 量 ， 可 以 使 用 
关键 字 区 分 ， 如 下 。 











wire vectored [7:0] databus; // 使 用 关键 字 vectored， 表 示 是 向 量 类 此 





reg scalared [31:0] rega; // 使 用 关键 字 scalared， 表 示 是 标量 类 此 











如 有 果 没 有 明确 指出 ， 那 么 默认 是 标量 类 问 量 。 本 书 也 只 用 到 了 标量 
类 问 量 ， 对 标量 类 问 量 可 以 任意 选中 其 中 的 一 位 或 相 邻 几 位 ， 分 别称 为 
位 选择 Cbit-select) 和 域 选 择 Cpart-select) 。 例 如 。 














A = rega[6]; // 位 选择 ， 将 向 量 rega 的 其 中 一 位 赋值 给 变量 A 
B = rega[5:2]; // 域 选择 ， 将 向 量 rega 的 第 5、4、3、2 位 赋值 给 变量 B 


在 OpenMIPS 的 实现 过 程 中 ， 使 用 了 存储 器 ， 存 储 器 可 看 作 是 二 维 
的 向 量 。 如 下 就 是 一 个 存储 器 的 定义 ， 定 义 了 一 个 深度 为 64， 每 个 元 素 
宽度 为 32bit 的 存储 器 。 


reg [31:0] mem[63:0]; // mem 是 深度 为 64， 字 长 为 32bit 的 存储 器 


2.5.4 运算 符 


Verilog HDL 中 定义 的 运算 符 包 括 : 算术 运算 符 、 逻 辑 运算 符 、 位 
运算 符 、 关 系 运算 符 、 等 式 运 算 符 、 缩 位 运算 符 、 移 位 运算 符 、 条 件 运 
算 符 和 位 拼接 运算 符 。 详 情 如 表 2-3 所 示 。 


表 2-3 Verilog HDL 中 定义 的 运算 符 














缩 位 运算 符 





位 拼接 运算 符 拼接 





表 2-3 中 的 大 部 分 运算 符 都 很 好 理解 ， 本 书 不 再 详 释 ， 只 做 如 下 几 
扩 说 明 。 





(1) 等 式 运算 符 中 的 “==” 与 “===” 的 区 别 是 ， 对 于 “==” 运 算 ， 参 与 
比较 的 两 个 操作 数 必须 逐 位 相等 ， 其 结果 才 为 1， 如 果菜 些 值 是 不 定 态 
X 或 局 阻 态 Z， 那 么 得 到 的 结果 是 不 定 值 X; 而 对 于 “===” 运 算 ， 则 要 求 
对 参与 运算 的 操作 数 中 为 不 定 态 X 或 高 阻 态 Z 的 位 也 进行 比较 ， 两 个 操 
作 数 必须 完全 一 致 ， 其 结果 才 为 1， 人 否则 结果 为 0。 例 如 。 








reg [4:0] a = 5'b11x01; 
reg [4:0] b = 5'b11x01; 


EA Lia, b, “a==b” 的 返回 结果 为 X， 而 “a===b” 的 返回 结果 为 

















2) 缩 位 运算 符 与 位 运算 的 运算 符号 、 逻 辑 运 算法 则 都 是 一 样 
的 ， 但 是 缩 位 运算 符 是 对 单个 操作 数 进行 与 、 或 、 异 或 的 递 推 运 算 ， 它 








放 在 操作 数 的 前 面 ， 能 够 将 一 个 矢量 减 为 一 个 标量 。 例 如 。 





而 位 运算 需要 对 两 个 操作 数 按 对 应 位 分 别 进行 逻辑 运算 ， 例 如 。 





(3) 位 拼接 运算 符 : 用 来 将 两 个 或 多 个 信号 的 某 些 位 拼接 起 来 。 
其 格式 如 下 。 


例如 ， 在 进行 加 法 运算 时 ， 可 将 和 与 进位 输出 拼接 在 一 起 使 用 。 





位 拼接 还 可 以 用 来 重复 信号 的 某 些 位 ， 其 格式 如 下 。 





利用 上 面 的 功能 ， 可 以 实现 对 信号 的 符号 扩展 ， 例 如 。 





(4) 运算 符 的 优先 级 如 图 2-9 所 示 。 





= 高 优先 级 


I 低 优先 级 


图 2-9 运算 符 的 优先 级 


2.6 Verilog HDL 行为 语句 


2.6.1 ”过 程 语句 


Verilog 定 义 的 模块 一 般 包 括 过 程 语句 ， 过 程 语句 有 两 种 : initial, 
always。 其 中 initial 常 用 于 仿真 中 的 初始 化 ， 其 中 的 语句 只 执行 一 次 ， 而 
always 中 语句 则 是 不 断 重复 执行 的 。 此 外 ， always 过 程 语 句 是 可 综合 
的 ，initial 过 程 语 句 是 不 可 综合 的 。 


1. always 过 程 语句 


always 过 程 语 句 的 格式 如 图 2-10 所 示 。 





always @ (< 敏感 信号 表达 式 >) 
begin 


// 语句 序列 


end 











22-10 ” always 过 程 语句 的 格式 





always 过 程 语句 通常 是 带 有 触发 条 件 的 ， 触 肥 条 件 写 在 敏感 信号 表 
达 式 中 ， 敏 感 信号 表达 陈 又 称 为 事件 表达 式 或 敏感 信号 列表 ， 当 该 表达 
式 中 变量 的 值 改 变 时 ， 就 会 引发 其 中 语句 序列 的 执行 。 因 此 ， 敏 感 信号 
表达 式 中 应 列 出 影响 块 内 取 值 的 所 有 信号 。 





(1) 敏感 信号 表达 式 的 格式 


如 果 有 两 个 或 两 个 以 上 的 敏感 信号 时 ， 它 们 之 间 使 用 “or” 连 接 ， 此 
处 还 是 以 32 位 加 法 器 为 例 ，2.4 节 是 使 用 assign 直 接 赋值 的 ， 其 实 也 可 以 
使 用 always 过 程 语句 实现 。 只 要 被 加 数 in1、 加 数 in2 中 的 任何 一 个 改 
变 ， 都 会 触发 always 过 程 语句 ， 在 其 中 进行 加 法 运算 。 这 里 有 两 个 敏感 
信号 in1、in2， 使 用 “or” 连 接 。 





敏感 信号 列表 中 的 多 个 信号 可 以 使 用 逗号 卫 开 ， 上 面 的 32 位 加 法 器 
可 以 修改 为 如 下 形式 。 


敏感 信号 列表 也 可 以 使 用 通配符 “*”， 表 示 在 该 过 程 语 句 中 的 所 有 
输入 信号 变量 ， 上 面 的 32 位 加 法 器 可 以 修改 为 如 下 形式 。 








(2) 组 合 电路 与 时 序 电路 


敏感 信号 可 以 分 为 两 种 类 型 ; 一 种 为 电 平 敏感 型 ， 另 一 种 为 边沿 敏 
感 型 。 前 一 种 一 般 对 应 组 合 电 路 ， 如 上 面 给 出 的 加 法 器 的 例子 ， 后 一 种 
一 般 对 应 时 序 电 路 。 对 于 时 序 电 路 ， 敏 感 信号 通常 是 时 钟 信号 ，Verilog 
HDL 提供 了 posedge、negedge 两 个 关键 字 来 描述 时 钟 信 号 。posedge 表 示 
以 时 钟 AH LIE negedge 表 示 以 时 钟 信号 的 下 降 沿 
作为 触发 条 件 。 还 是 以 32 位 加 法 器 为 例 ， 可 以 为 其 添加 一 个 时 钟 同步 信 
5, MP: 





out = ini + in2; 


end 


endmodule 


在 时 钟 信 号 的 上 升 沿 ， 才 会 进行 加 法 运算 ， 这 一 点 与 前 面 的 加 法 器 
不 同 ， 也 就 是 当 被 加 数 in1、 加 数 ip2 变 化 时 ， 并 不 会 立即 改变 输出 out， 
而 是 要 等 竺 时钟 信号 的 上 升 沿 。 


2. initial 2184) 


initial 过 程 语 句 的 格式 如 图 2-11 所 示 。 





initial 
begin 


// 语句 序列 


end 








图 2-11 initial 过 程 语 名 的 格式 


initial 过 程 语句 不 市 触发 条 件 ， 并 且 其 中 的 语句 序列 只 执行 一 次 。 
initial 过 程 语 句 通 常用 于 仿真 模块 中 对 激励 问 量 的 描述 ， 或 用 于 给 寄存 
器 赋 初 值 ， 它 是 面 癌 模拟 仿真 的 过 程 语 多， 通常 不 能 被 综合 。 如 下 是 
initial 过 程 语句 的 一 个 例子 ， 用 于 给 存储 器 mem 赋 初 值 。 





initial 


begin 
for(addr = 0; addr < size; addr = addr+1) // for 是 一 种 循环 语句 ， 
mem[addr] = 0; 


end 


2.6.2 ”赋值 语句 


赋值 语句 有 两 种 :持续 赋值 语句 、 过 程 赋 值 语句 。 
1. 持续 赋值 语句 


assign 为 持续 赋值 语句 ， 主 要 用 于 对 wire 型 变量 的 赋值 。 如 上 文中 
加 法 器 的 例子 。 


2. 过 程 赋值 语句 


在 always、initial 过 程 中 的 赋值 语句 称 为 过 程 赋值 语句 ， 多 用 于 对 
reg 型 变量 进行 赋值 ， 分 为 非 阻 塞 赋值 和 阻塞 赋值 两 种 方式 。 


(1) 非 阻 塞 赋值 (Non-Blocking) 
赋值 符号 为 “<=”， 例 如 。 


b<=a 





非 阻 塞 赋值 在 整个 过 程 语句 结束 时 才 会 完成 赋值 操作 ， 即 b 的 值 并 
不 是 立刻 改变 的 。 


(2) 阻塞 赋值 (Blocking ) 


赋值 符号 为 “=”， 例 如 。 


ea 








阻塞 赋值 在 该 语句 结束 时 就 立即 完成 赋值 操作 ， 即 b 的 值 在 这 条 语 
句 结束 后 立刻 改变 。 如 果 在 一 个 块 语句 中 ， 有 多 条 阻塞 赋值 语句 ， 那 么 
在 前 面 的 赋值 语句 没有 完成 之 前 ， 后 面 的 语句 就 不 能 被 执行 ， 仿 佛 被 阻 
塞 了 一 样 ， 因 此 称 为 阻塞 赋值 方式 。 











在 always 过 程 块 中 ， 阻 塞 赋值 可 以 理解 为 赋值 语句 是 顺序 执行 的 ， 
而 非 阻 窗 赋值 可 以 理解 为 赋值 语句 是 并 发 执行 的 。 如 图 2-12 所 示 。 在 一 
个 过 程 块 中 ， 阻 塞 式 赋值 与 非 阻 奢 式 赋 值 只 能 使 用 其 中 一 种 。 








always @ (°*** X always @ (*** ); 
begin begin 
4<=atl; A a=atl; SS TEN 
bear: a 所 有 行 同 时 计算 b=atl: O 由 上 到 下 计算 
end end 





如 果 执 行 前 a 的 值 为 0， 那 么 执行 上 面 
的 过 程 语句 后 ，a 为 1，b 为 1 








如 果 执 行 前 a 的 值 为 0， 那 么 执行 上 面 
的 过 程 语 句 后 ，a 为 1，b 为 2 








2.6.3 


非 阻塞 赋值 





阻塞 赋值 


22-12 ARMAS MARA 


条 件 语句 


. if-elsei= A) 


条 件 语 句 有 if-else、case 两 种 ， 应 放 在 always 块 内 。 分 别 介 绍 如 下 。 





if-else 语 句 的 格式 有 如 下 三 种 。 





上 述 格 式 中 的 “表达 式 ” 一 般 为 逻辑 表达 式 或 关系 表达 式 ， 也 可 能 是 
1 位 的 变量 。 系 统 对 表达 式 的 值 进行 判断 ， 如 果 为 0、X、Z， 则 
按 “ 假 ”处 理 ， 如 果 为 1， 则 按 “ 真 ”处 理 。 语 句 序 列 可 以 是 单 句 ， 也 可 以 
是 多 句 ， 多 人 句 时 需 使 用 begin-end 块 语句 括 起 来 。 


还 是 以 32 位 加 法 器 为 例 ， 为 其 添加 一 个 复位 信号 rst， 如 果 rst 为 高 电 
平 ， 那 么 复位 信号 有 效 ， 输 出 out 为 0， 反 之 ， 复 位 信号 无 效 ， 输 出 out 为 
两 个 输入 信号 之 和 。 








2. case 语 名 


相对 于 if-else 语 句 只 有 两 个 分 支 而 言 ，case 语 句 是 一 种 多 分 支 语 
人 句 ， 所 以 case 语 句 多 用 于 多 条 件 译 码 电路 ， 如 译 码 器 、 数 据 选 择 器 、 状 
态 机 及 微 处 理 器 的 指令 译 码 等 。 其 格式 如 下 。 





当 敏 感 表达 式 的 值 等 于 “ 值 1 时 ， 执 行 语句 序列 1， 当 等 于 “ 值 
2” 时 ， 执 行 语句 序列 2， 依 次 类 推 。 如 果 敏 感 表达 式 的 值 与 上 面 列 出 的 
值 都 不 符 ， 那 么 执行 default 后 面 的 语句 序列 。 如 下 代码 是 一 个 简单 的 运 
算 单元 ， 可 执行 加 法 或 减法 运算 ， 如 果 输 入 变量 type 的 值 为 1， 那么 执 


行 加 法 运算 ， 如 果 type 的 值 为 0， 那 么 执行 减法 运算 。 





case 语 名 中 ， 敏 感 表达 式 与 值 1~n 之 间 的 比较 是 一 种 全 等 比较 ， 必 
须 保证 两 者 的 对 应 位 全 等 。casez、casex 语 句 是 case 语 句 的 两 种 扩展 。 


e 在 casez 语 名 中， 如 果 比 较 的 双方 某 些 位 的 值 为 高 阻 Z， 那 么 对 
这 些 位 的 比较 结果 就 不 予 考 虑 ， 只 需 考虑 其 他 位 的 比较 结果 。 
e 在 casex 语 句 中 ， 如 果 比 较 的 双方 某 些 位 的 值 为 Zz 或 X， 那 么 对 
这 些 位 的 比较 结果 就 不 予 考虑 ， 只 需 考 虑 其 他 位 的 比较 结果 。 


此 外 ， 还 有 一 种 表示 X 或 Zz 的 方式 ， 即 用 表示 无 关 值 的 符号 “?” 来 表 
示 ， 例 如 。 





2.6.4 循环 语句 

Verilog ”HDL 中 存在 四 种 类 型 的 循环 语句 : for, forever, repeat, 
while， 用 来 控制 语句 的 执行 次 数 ， 分 别 介绍 如 下 。 

1. for 语 句 


for 语 句 的 格式 如 下 。 这 与 C 语 言 是 相似 的 。 





一 个 使 用 for 语 句 实 现 7 人 表决 器 的 例子 如 下 。 通 过 for 循 环 统计 赞成 
的 人 数 ， 若 超过 4 人 “〔 含 4 人 ) 赞成 则 通过 ， 其 中 vote[7:1] 表 示 7 个 人 的 投 
票 情 况 ，vote[i] 为 1， 表 示 第 i 个 人 投 的 是 赞成 票 ， 反 之 是 反对 票 ，pass 是 


输出 ， 超 过 4 个 人 赞成 ，pass 为 1， 反 之 为 0。 


2. forever 语 句 


forever 语 句 的 格式 如 下 。 








forever 循 环 语句 连续 不 断 地 执行 其 中 的 语句 序列 ， 常 用 来 产生 周期 
性 的 波形 。 在 2.8 节 编写 仿真 用 的 Test Bench 文 件 时 ， 会 给 出 forever 语 句 
的 例子 。 


3. repeat 语 句 


repeat 语 句 的 格式 如 下 。 





4. whilei#%] 


while 语 句 的 格式 如 下 。 





while 语 句 在 执行 时 ， 首 先 判断 循环 执行 条 件 表达 式 是 否 为 真 ， 磊 


为 真 ， 则 执行 其 中 的 语句 序列 ， 然 后 再 次 判断 循环 执行 条 件 表达 式 是 否 
为 真 ， 知 为 真 ， 则 再 次 执行 其 中 的 语句 序列 ， 如 此 反复 ， 直 到 循环 执行 
条 件 表达 式 不 为 真 为 止 。 


2.6.5 ”编译 指示 语句 


Verilog HDL 和 C 语 言 一 样 提供 了 编译 指示 功能 ， 人 允许 在 程序 中 使 用 
编译 指示 (Compiler Directives) 语句 ， 在 编译 时 ， 通 和 常 先 对 这 些 指示 语 
句 进 行 预 处 理 ， 然 后 再 将 预 处 理 的 结果 和 源 程序 一 起 进行 编译 。 


编译 指示 语句 以 “” 开 始 ， 以 区 别 其 他 语句 。 和 常用 的 编译 指示 语句 
A: “define、`include、`ifdef、`else、`endif， 分 别 介绍 如 下 。 


1. + define 


"define 可 以 用 一 个 简单 的 名 字 或 有 意义 的 标识 〈 也 称 为 宏 名 ) NE 
一 个 复杂 的 名 字 或 变量 ， 其 格式 如 下 。 


“define 宏 名 变量 或 名 字 











例如 : 一 般 在 时 序 电 路 中 会 有 一 个 复位 信号 ， 妆 该 复位 信号 为 高 电 
平时 表示 复位 信号 有 效 ， 当 该 复位 信号 为 低 电 平时 ， 表 示 复 位 信和 号 无 
效 。 分 别 执行 不 同 的 代码 ， 如 下 。 

















always @ (clk) 
begin 
if(rst == 1'b1) 
// 复 位 有 效 





一 种 更 为 友好 的 书写 方式 ， 是 使 用 宏 定 义 ， 如 下 。 





2.`incIude 语 句 


`include 是 文件 包含 语句 ， 它 可 将 一 个 文件 全 部 包含 到 男 一 个 文件 
中 ， 使 用 格式 如 下 。 


在 OpenMIPS 处 理 器 的 实现 过 程 中 ， 我 们 定义 了 很 多 宏 ， 这 些 宏 都 
集中 在 文件 defines.v 中 ， 如 果 某 一 程序 需要 使 用 其 中 的 安定 义 ， 就 可 以 
在 程序 文件 的 开始 使 用 `include 语 句 将 defines.v 文 件 包含 进来 即 可 ， 如 


ES 


3. 条 件 编 译 语句 `ifdef、`else、`endif 


条 件 编译 语句 `ifdef、`else、`endif 可 以 指定 仅 对 程序 中 的 部 分 内 容 
进行 编译 ， 有 两 种 使 用 形式 。 


第 一 种 使 用 形式 如 下 。 当 指定 的 宏 在 程序 中 已 定义 ， 那 么 其 中 的 语 
句 序列 参与 源 文件 的 编译 ， 否 则 ， 其 中 的 语句 序列 不 参与 源 文件 的 纺 
译 。 





第 二 种 使 用 形式 如 下 。 当 指定 的 宏 在 程序 中 已 定义 ， 那 么 其 中 的 语 
句 序列 1 参与 源 文件 的 编译 ， 否 则 ， 其 中 的 语句 序列 2 参与 源 文件 的 编 
译 。 





语句 序列 2 


“endif 


2.6.6 ”行为 语句 的 可 综合 性 


前 面 几 小 节 介 绍 了 Verilog ”HDL 中 的 多 种 行为 语句 ， 包 括 过 程 语 
句 、 赋 值 语 句 、 条 件 语 句 、 循 环 语句 、 编 译 指示 语句 ， 所 有 的 语句 都 能 
在 仿真 中 使 用 ,但 是 有 些 语句 是 不 可 综合 的 ， 也 就 是 说 综合 器 无 法 将 这 
些 语句 转变 为 对 应 的 硬件 电路 。Verilog HDL 行为 语句 可 综合 性 的 情况 
如 表 2-4 所 示 。 








表 2-4 Verilog HDL 行 为 语句 的 可 综合 性 


forever 





循环 语句 Po = 
=æ | 
w | 


“include 


‘ifdef. “else, “endif 


编译 指示 语句 





27 ”电路 设计 举例 


本 节 将 设计 一 个 简化 的 处 理 器 取 指 令 电路 ， 通 过 这 个 例子 体会 
Verilog HDL 的 使 用 。 

处 理 器 内 部 一 般 有 一 个 PC 寄存 器 ， 其 中 存储 指令 地 址 ， 正 常 运行 
过 程 中 ，PC 的 值 会 随时 间 增 加 ， 同 时 从 指令 存储 器 中 取出 对 应 地 址 的 
HS. 。 所 以 ， 本 节 实 现 的 处 理 器 取 指 令 电路 ， 包 含 两 部 分 :PC 模块 、 
指令 存储 器 。 


1. PC 模块 的 设计 与 实现 


PC 模块 的 功能 就 是 给 出 取 指令 地 址 ， 同 时 每 个 时 钟 周 期 取 指 令 地 
址 递增 。 其 接口 设计 如 图 2-13 所 示 。 采 用 左边 是 输入 接口 、 右 边 是 输出 
接口 的 方式 绘制 ， 这 样 便于 理解 。 接 口 作用 描述 如 表 2-5 所 示 。 


PC 





rst pc 


clk ce 
图 2-13 ”PC 模块 的 接口 


表 2-5 PC 模块 的 接口 描述 


En 宽度 (bit) ACH 作 用 


ESOO ECO ECT ET 
此 处 定义 指令 地 址 pc 的 宽度 为 6，PC 模 块 的 主要 代码 如 下 ， 可 以 参 
考 本 书 光盘 Code\Chapter2 目 录 下 的 pc_reg.v 文 件 。 








pc <= 6'h00; // 指 令 存 储 器 使 能 信和 号 无 效 的 时 候 ，pc 保 持 为 9 
end else begin 

pc <= pc + 1'b1;  // 指 令 存储 器 使 能 信号 有 效 的 时 候 ，pc 在 每 个 时 钟 加 1 
end 


end 


endmodule 
2. 指令 存储 器 ROM 的 设计 与 实现 


指令 存储 器 ROM 的 作用 是 存储 指令 ， 并 依据 输入 的 地 址 ， 给 出 对 
应 地 址 的 指令 。 其 接口 如 图 2-14 所 示 ， 还 是 采用 左边 是 输入 接口 、 石 边 
古 输出 接口 的 方式 绘制 ， 这 样 便于 理解 。 接 口 描述 如 表 2-6 所 示 。 


ROM 
addr inst 
ce 
图 2-14 ROM 模块 的 接口 
表 2-6 ROW 模块 的 接口 描述 


ER (oi 
paje [ho o 


输入 








8 addr 6 要 读 取 的 指令 地 址 
3 inst 32 读 出 的 指令 
此 处 定义 指令 的 宽度 为 32， 指 令 存 储 器 ROM 的 主要 代码 如 下 ， 可 
以 参考 在 本 书 光盘 Code\Chapter2 目录 下 的 rom.v 文 件 。 











其 中 使 用 了 一 个 二 维 向 量 定义 存储 器 ， 深 度 是 64， 每 个 元 素 的 宽度 


是 32， 这 也 是 使 用 6 位 地 址 即 可 的 原因 。 


3. 顶层 文件 








先 介绍 元 件 例 化 的 知识 ， 在 一 个 复杂 电路 的 实现 过 程 中 ， 可 以 将 其 
分 割 成 多 个 功能 单元 分 别 实现 ， 然 后 在 一 个 顶层 文件 中 通过 调用 各 个 功 
能 单元 ， 将 其 按照 一 定 方式 连接 在 一 起 ， 从 而 实现 最 终 电路 。 其 中 调用 





功能 单元 的 过 程 就 称 为 元 件 例 化 。 元 件 例 化 的 格式 如 图 2-15 所 示 。 





< 模块 名 > < 实例 名 >( 


,< 相连 的 端口 名 >( 相 连 的 信号 名 














92-15 元 件 例 化 的 格式 


经 过 上 面 两 步 ， 我 们 分 别 实现 了 PC 模块 、 指 令 存 储 器 ROM， 现 在 
可 以 编写 顶层 文件 将 两 者 连接 起 来 。 连 接 方式 如 图 2-16 所 示 。 

















inst_fetch 
PC ROM 
rst rst pe > addr inst inst_o 
clk clk ce m ce 
































图 2-16 顶层 文件 inst_fetch 


PC 模块 的 输出 pc 连接 到 指令 存储 器 ROM 的 地 址 接口 addr，PC 模 块 
输出 的 使 能 信号 ce 连接 到 ROM 的 使 能 信号 接口 ce。 顶 层 模 块 对 应 的 模块 
名 为 inst_fetch， 有 三 个 接口 ， 接 口 描 述 如 表 2-7 所 示 。 





表 2-7 顶层 文件 inst_fetch 模 块 的 接口 描述 


复位 信号 





时 钟 信号 


o je a e ea 


inst_fetch 模 块 的 主要 代码 如 下 ， 其 中 例 化 了 PC 模块 、 指 令 存 储 器 
ROM。 可 以 参考 本 书 光 盘 Code\Chapter2 目录 下 的 inst_fetch.v 文 件 。 








PC 模块 的 输出 pc、ROM 模 块 的 输入 addr 都 连接 到 变量 pc， 所 以 两 者 
连接 在 一 起 ; PC 模块 的 输出 ce、ROM 模 块 的 输入 ce 都 连接 到 rom _ce， 
所 以 两 者 连接 在 一 起 。 这 样 束 实现 了 图 2-16 所 示 的 连接 关系 。 


28 仿真 


2.7 市 实现 了 一 个 简化 的 处 理 器 取 指 电路 ， 需 要 通过 仿真 以 验证 其 
功能 是 否 正 确 ， 直 观 的 仿真 四 路 就 是 : 给 出 一 个 时 钟 信号 ， 上 述 电路 会 
在 每 个 时 钟 信 号 上 升 治 将 取 指 地 址 加 1， 同 时 从 指令 存储 器 中 取出 一 条 
指令 ， 观 察 取 指 地 址 是 否 依次 递增 ， 同 时 观察 取出 的 指令 是 否 是 存储 器 
中 取 指 地 址 对 应 的 指令 ， 如 果 者 符合， 那么 上 述 取 指 电路 就 实现 正确 。 
此 处 涉及 两 个 问题 。 


C1) 如 何在 指令 存储 颖 中 存储 指令 ， 也 就 是 指令 存储 器 初始 化 问 


2) 如 何 给 出 时 钟 信号 ? 


本 节 将 分 别 解答 上 述 问题 ， 在 此 基础 上 ， 使 用 ModelSim 进 行 仿 
真 。 


2.8.1 系统 函数 


初始 化 存储 器 有 两 种 方法 ， 一 种 是 对 存储 融 中 每 个 存储 单元 依次 给 
出 初 值 ， 如 下 。 


rom[0] = 32'h00000000; // 存 储 器 rom 的 第 0 个 元 素 初 始 化 为 0X00000000 
rom[1] = 32'ho1010101; // 存 储 器 rom 的 第 1 个 元 素 初 始 化 为 0x01010101 
rom[2] = 32'h02020202; // 存 储 器 rom 的 第 2 个 元 素 初 始 化 为 0xX02020202 


rom[3] = 32'h03030303; ”// 存 储 器 rom 的 第 3 个 元 素 初 始 化 为 0X03030303 


另 一 种 方法 是 使 用 系统 函数 $readmemh， 这 样 更 加 方便 ， 但 是 后 者 
只 能 用 于 仿真 中 。 





除了 $readmemh 外 ， 在 Verilog HDL 中 还 定义 了 很 多 系统 函数 ， 比 如 
显示 当前 仿真 时 间 的 函数 $timne、 显 示 信 号 值 的 图 数 $display、 和 暂停 仿真 
过 程 的 函数 $stop、 结 束 仿真 过 程 的 函数 $finish 等 。 本 书 主 要 用 到 了 
$stop、$readmemh 这 两 个 系统 函数 。 








1. $stop 





$stop 用 于 对 仿真 过 程 进行 控制 ， 暂 停 仿真 ， 其 使 用 格式 如 下 。 


$stop(); // 使 用 格式 一 ， 不 带 参 数 
$stop(n); // 使 用 格式 二 ， 带 参数 n，n 可 以 等 于 9、1、2 等 值 ， 含 义 如 下 : 


// 0: 不 输出 任何 信息 ; 
// 1: 给 出 仿真 时 间 和 位 置 
// 2: 给 出 仿真 时 间 和 位 置 ， 还 有 其 他 一 些 运行 统计 数据 


当 仿 真 程序 执行 到 $stop 语 句 时 ， 将 暂时 停止 仿真 ， 此 时 设计 者 可 以 
输入 命令 ， 对 仿真 器 进行 交互 控制 。 


2. $readmemh 


$readmemh 函 数 用 于 读 取 文件 ， 其 作用 是 从 外 部 文件 中 读 取 数据 并 
放 入 存储 器 中 。 使 用 格式 如 下 。 


$readmemh(" 数 据 文 件 名 "， 存储 对 象 ) ; 


将 第 1 个 参数 指定 文件 的 数据 读 入 第 2 个 参数 指定 的 存储 器 中 。 例 
Zn. 


reg[31:0] rom[63:0]; 


initial $readmemh ( "rom.data", rom ); // 读 入 文件 rom.data 的 数据 到 r 


此 处 对 数据 文件 的 格式 有 一 定 要 求 ， 要 求 使 用 十 六 进 制 记录 数据 ， 
且 每 一 行 记 录 一 个 地 址 的 数据 。 例 如 : rom.data 的 内 容 如 下 ， 每 一 行 是 
一 个 32 位 的 数据 。 








00000000 
01010101 
02020202 
03030303 


使 用 $readmemh ( "rom.data", rom ) 函 数 后 ，rom 的 内 容 就 会 初始 化 为 
如 下 。 rom[0]:  32'h00000000; /存储 器 rom 的 第 0 个 元 素 初 始 化 为 
0x00000000 


rom[1]: 32'h01010101;  // 存 储 器 rom 的 第 1 个 元 素 初 始 化 为 0X01010101 
rom[2]: 32'h02020202;  ”// 存 储 器 rom 的 第 2 个 元 素 初 始 化 为 0X02020202 
rom[3]: 32'h03030303;  ”// 存 储 器 rom 的 第 3 个 元 素 初 始 化 为 0X03030303 


回 到 本 节 最 开始 提出 的 两 个 问题 ， 现 在 可 以 回答 第 一 个 问题 了 ， 为 
了 实现 对 指令 存储 器 的 初始 化 ， 只 需要 创建 一 个 数据 文件 ， 其 内 容 如 上 
面 的 rom.data 所 示 ， 然 后 在 指令 存储 器 rom.v 中 ， 增 加 代码 $readmemh ( 


"rom.data", rom ) 即 可 。 完 整 代码 可 以 参考 本 书 光 盘 Code\Chapter2 目 录 下 
的 rom.v 文 件 。 


2.8.2 Test Bench 


现在 回答 本 节 最 开始 提出 的 第 二 个 问题 ， 通 过 创建 Test Bench 文 件 
以 给 出 时 钟 信号 。 
Test Bench 为 测试 或 仿真 一 个 Verilog HDL 程序 搭建 了 一 个 平台 ， 我 


们 给 个 测试 的 模块 施加 激励 信号 ， 通 过 观察 被 测试 模块 的 输出 啊 应 ， 从 
而 判断 其 逻辑 功能 实现 得 正确 与 否 。 如 图 2-17 所 示 。 





测试 平台 Test Bench 








A 输入 激励 信号 ， 一 般 是 reg 类 型 








iy ek ES) 
测试 模块 待 测试 模块 


输出 显示 一 一 一 一 一 




















输出 显示 信号 ，wire 类 型 











图 2-17 Test Bench 示 意 


Test Bench 的 结构 如 图 2-18 所 示 ， 与 2.4 节 介绍 的 Verilog HDL 模块 的 
结构 没有 根本 区 别 ， 但 有 自身 的 一 些 特 点 。 





e Test Bench 只 有 模块 名 ， 没 有 端口 列表 ; WDA T RABIA 
测试 模块 的 信号 ) 必须 定义 为 reg 类 型 ， 以 保持 信号 值 ， 从 待 


测试 模块 输出 的 信号 《用户 观察 的 信号 ) 必须 定义 为 wire 类 
型 。 

。 在 Test Bench 中 要 调用 被 测试 模块 ， 也 就 是 元 件 例 化 。 

e Test Bench 中 一 般 会 使 用 initial、always 过 程 块 来 定义 、 描 述 激 
励 信 号 。 





module <Test Bench 名 >; 
< 数据 类 型 说 明 > / 激励 信号 使 用 reg 类 型 ， 显 示 信号 使 用 wire 类 型 
< 激励 向 量 定义 > /always、initial 过 程 块 等 
< 待 测试 模块 例 化 > 


endmodule 











图 2-18 Test Bench 的 一 般 结 构 


为 简单 取 指 令 电 路 设计 的 Test Bench 如 下 ， 完 整 代 码 位 于 本 书 光 盘 
Code\Chapter2 目 录 下 的 inst_fetch_tb.v 文 件 。 








.inst_o(inst) 


de 


endmodule 


2.8.3 ModelSim/5 E 

中 令 存 储 器 初始 化 问题 解决 了 、 时 钟 信 号 也 给 出 了 ， 现 在 可 以 使 用 
ModelSim 进 行 仿 真 了 。 

1. 建立 ModelSim 工 程 


打开 ModelSim， 选 择 File->New->Project， 出 现 新 建 工 程 对 话 框 ， 
其 中 填写 工程 名 ， 选 择 保存 目录 ， 注 意 保 存 目 录 中 不 要 有 中 文 ， 如 图 2- 
19 所 示 。 











RA Create Project 
Project Name 
inst_fetch 


Project Location 
F:/VerilogHDL/OpenMIPS/Chapter2 Browse... 





Default Library Name 
work 





Copy Settings From 
odeltech_10.1a/modelsim.ini Browse... 
(* Copy Library Mappings € Reference Library Mappings 


OK Cancel 


图 2-19 ”新 建 Mode1Sim 工 程 对 话 框 








单 击 OK 按 钮 后 ， 会 出 现 图 2-20 所 示 的 界面 ， 这 里 单 击 Add Existing 





File， 也 就 是 添加 已 有 文件 ， 出 现 图 2-21 所 示 的 添加 文件 对 话 框 。 


Fj Add items to the Project ES 
Click on the icon to add items of that type: 


Create New File Add Existing File 


[Y] Add file to Project 
File Name 


M a 


Create Simulation Create New Folder 





Add file as type Folder 
| [Top Level 








( Reference from current location © Copy to project directory 


_0K | Cancel | 


Close 


图 2-20 选择 添加 已 有 文件 图 2-21 添加 文件 对 话 框 





单 击 Browse 按 钮 ， 出 现 选择 文件 对 话 框 ， 找 到 本 书 光盘 的 
Code\Chapter2 目 录 ， 添 加 其 中 所 有 的 .v 文 件 ， 如 图 2-22 所 示 。 


Select files to add to project 


O E 








文件 名 四 ): \"inst_fetch. v" “inst_fetch_tb.v" "peu >| HF 0) | 
HEUT: [MDL Files (k.v, *. vl, *. vhd, *. vhdl, *. vh y] 取消 











图 2-22 ”添加 Code\Chapter2 目 录 下 的 所 有 .v 文 件 


选择 要 添加 的 文件 后 ， 单 击 “ 打 开 ” 按 钮 ， 即 完成 添加 ， 此 时 显示 图 
2-23 所 示 界 面 ， 在 其 中 选中 copy to project directory， 这 样 就 会 将 刚才 选 
中 的 文件 复制 到 新 的 工程 目录 下 。 


[Y] Add file to Project 


File Name | 
E: /VerilogHDL/OpenMIPS/Chapter2/inst_fetch.v Browse... 





Add file as type Folder 


| >| [Top Level 可 | 


© Reference from current location (* Copy to project directory 


OK Cancel 











图 2-23 选择 Copy to project directory 


文件 添加 完成 后 ， 会 在 ModelSim 的 主 界面 中 显示 所 有 文件 的 状 
态 ， 其 中 问号 表示 对 应 文件 没有 编译 。 任 意 选 中 一 个 文件 ， 用 鼠标 右键 
单 击 ， 在 弹出 六 单 中 选择 Compile->Compile All， 即 开始 编译 所 有 文 
件 ， 如 图 2-24 所 示 。 稍 等 几 秒 钟 就 编译 结束 了。 编译 结束 后 ， 所 有 的 文 
件 状 态 都 应 该 是 一 个 绿色 的 “V”。 











ama Project -F:/VerilogHDL/OpenMIPS/Chapter2/inst_fetch 










Verilog 











Compile Selected 


— 


eg. 
fa) pcregv Add to Project 上 Compile All 





Remove from Project Compile Out-of-Date 
Close Project Compile Order... 
Update Compile Report... 
ae ol Compile Summary... 
Properties... GENE RA = 


Project Settings... Compile Properties... 








图 2-24 编译 所 有 文件 


2. 开始 仿真 


切换 到 Library 这 个 Tab， 然 后 展开 work 目 录 ， 在 inst_fetch_ tb 文件 上 
单 击 右键 ， 在 弹出 菜单 中 选择 Simulate， 如 图 2-25 所 示 。 


Library 


inst_fetch_th 


Sk vital2000 Simulate without Optimization 
SR verilog Simulate with full Optimization 
+) synopsys Simulate with Coverage 
SR sv_ std Edit 

SA std_developersk 

+ std Recompile 

Optimize 

Update 


Create Wave 





Delete 

Copy 

A mc2_ib (empty) New 
SR ¡eee 


SH floatfixlib Properties... 








图 2-25 #inst_fetch tb 上 单 击 右键 ， 选 择 Simulate 


此 时 会 增加 一 个 Tab， 名 称 为 sim， 展 开 其 中 的 inst_fetch tb 节点 ， 
选择 inst_fetch0， 会 在 Objects 窗 口中 显示 inst_fetch 模 块 的 所 有 信号， 如 
图 2-26 所 示 ， 如 果 没 有 出 现 Objects 窗 口 ， 可 以 通过 菜单 View->Objects 调 
出 该 窗口 。 





j | 
Nane Value |Kind [Mode | 





Stx Net In 

stx Net Internal 
(++ gf pc_regd XXKXKK Net Internal 
+} gf romo 42 inst_o KXXXXXXXXXXXXXXX... Net 








@ #INITIAL#9 2 dk Stx Net 


图 2-26 在 0bjects 窗 口中 显示 选中 模块 的 所 有 信号 





选择 Objects 窗 口中 的 所 有 信号 ， 然 后 单 击 右键 ， 在 弹出 沫 单 中 选择 


Add to ->Wave->Selected Signals， 如 图 2-27 所 示 ， 将 所 有 信号 都 添加 到 
Wave 窗口 中 。 这 些 都 是 要 观察 的 信号 。 添 加 要 观察 信号 后 的 Wave 窗口 


如 图 2-28 所 示 。 


HR] ma] Wave - Default 一 





"*|Instance 


























图 2-28 添加 要 观察 信号 后 的 Wave 窗口 





选择 要 观察 的 信号 


图 2-27 


单 击 工具 栏 中 的 Run-Al 按 钮 ， 束 可 开始 仿真 ， 如 图 2-29 所 示 ， 仿 真 
结果 如 图 2-30 所 示 。 从 仿真 结果 可 知 ， 处 理 占 取 指 令 电 路 实现 正确 。 





CO 时 钟 信号 每 隔 10ns 翻 转 一 次 ， 一 个 时 钟 周 期 是 20ns， 所 以 频率 是 50MHz 
(2) 在 195ns 的 时 候 复 位 信号 转 为 无 效 



































|| (5) inst_o 就 是 指令 存储 
器 ROM 中 地 址 为 pc 处 对 





应 的 指令 





(3) 指令 存储 器 使 能 信号 ce 有 效 ， 开 始 取 指 / 
(4) 取 指 地 址 依次 递增 


| 点 击 Run-All， 开 始 仿真 





图 2-30 仿真 结果 


单 击 Run-A11 按 钮 开始 仿真 


图 2-29 


2.9 本章 小 结 


本 章 花 了 比较 大 的 篇 幅 介 绍 了 可 编程 逻辑 器 件 的 基本 知识 ， 以 及 基 
于 可 编程 逻辑 器 件 的 数字 系统 设计 流程 ， 包 括 设计 输入 、 综 合 、 布 局 布 
线 、 下 载 、 仿 真 等 几 步 ， 这 与 传统 的 数字 系统 设计 流程 还 是 有 很 大 不 同 
的 。 然 后 介绍 了 Verilog HDL 这 样 一 种 硬件 编程 语言 ， 这 也 是 将 要 用 来 
实现 OpenMIPS 处 理 器 的 语言 。 在 此 基础 上 ， 设 计 实 现 了 一 个 简化 的 处 
理 器 取 指 令 电路 ， 并 使 用 ModelSim 仿 真 验证 该 电路 实现 的 正确 性 。 在 
后 期 教学 版 OpenMIPS 的 设计 实现 过 程 中 ， 主 要 也 是 使 用 ModelSim 仿 真 
验证 ， 步 又 都 是 一 样 的 。 














从 第 3 章 开 始 ， 就 正式 进入 OpenMIPS 处 理 器 的 设计 实现 阶段 了 。 


教学 版 OpenMIPS 处 理 器 蓝图 
第 一 条 指令 ori 的 实现 
逻辑 、 移 位 操作 与 空 指令 的 实现 


移动 操作 指令 的 实现 





算术 操作 指令 的 实现 

转移 指令 的 实现 

加 载 存储 指令 的 实现 
协 处 理 需 访问 指令 的 实现 


异常 相关 指令 的 实现 
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从 本 章 开始 将 一 步 一 步 地 实现 教学 版 OpenMIPS 处 理 嚣 。 本 间 给 出 
了 教学 版 OpenMIPS 的 系统 昌 图 ， 首 先 介绍 了 系统 的 设计 目标 ， 其 中 详 
细 说 明了 OpenMIPS 处 理 器 计划 实现 的 5 级 流水 线 。3.2 市 给 出 了 
OpenMIPS 处 理 器 的 接口 示意 图 ， 以 及 各 个 接口 的 作用 。3.3 市 简单 解释 
了 各 个 源 代 码 文件 的 作用 ， 最 后 描述 了 OpenMIPS 处 理 器 的 实现 方法 。 
读者 将 发 现 本 书 给 出 的 实现 方法 与 现 有 书籍 的 方法 完全 不 同 ， 更 加 易于 
理解 、 便 于 实践 。 





3.1 


3.1.1 


系统 设计 日 标 


设计 目标 


本 书 第 二 篇 设计 实现 的 教学 版 OpenMIPS 处 理 器 ， 是 一 款 具 有 哈佛 
结构 的 32 位 标量 处 理 器 ， 兼 容 MIPS32 Release 1 指令 集 架 构 〈 后 文 不 再 
注 明 Release 1) ， 这 样 的 好 处 是 可 以 使 用 现 有 的 MIPS 编 译 环境 ， 如 : 
GCC 编译 器 等 。OpenMIPS 的 设计 目标 如 下 。 


五 级 整数 流水 线 ， 分 别 是 : 取 指 、 译 码 、 执 行 、 访 存 、 回 写 。 
哈佛 结构 ， 分 开 的 指令 、 数 据 接口 。 

32 个 32 位 整数 寄存 器 。 

大 端 模式 。 

器 量化 异常 处 理 ， 支 持 精 确 异 常 处 理 。 

支持 6 个 外 部 中 断 。 

具有 32bit 数 据 、 地 址 总 线 宽度 。 

能 实现 单 周 期 乘法 。 


支持 延迟 转移 。 
兼容 MIPS32 指 令 集 架构 ， 支 持 MIPS32 指 令 集 中 的 所 有 整数 指 
令 。 


大 多 数 指令 可 以 在 一 个 时 钟 周期 内 完成 。 








上 述 设计 目标 都 很 容易 理解 ， 除 了 延迟 转移 和 精确 异 毅 ， 前 者 将 在 
第 8 章 “ 转 移 指 令 的 实现 ?中 介绍 ， 后 着 将 在 第 11 章 “异常 相关 指令 的 实 








现 ” 中 介绍 。 


3.1.2 五 级 流水 线 


本 书 讲 的 是 计算 机 中 的 流水 线 ， 首 先 看 一 下 维基 百科 中 对 计算 机 流 
水 线 的 定义 : 流水 线 是 指 将 计算 机 指令 处 理 过 程 拆 分 为 多 个 步骤 ， 并 通 
过 多 个 硬件 处 理 单 元 并 行 执行 来 加 快 指令 执行 速度 。 此 处 有 两 个 关键 
词 : (1) 拆 分 ，〈2) 并 行 。 指 令 的 处 理 从 直观 上 分 析 至 少 可 以 拆 分 为 
三 步 : 从 存储 器 取出 指令 、 解 释 指 令 、 按 照 解释 的 结果 执行 ， 简 单 地 说 
就 是 : 取 指 、 译 码 、 执 行 。 如 果 我 们 只 有 一 个 硬件 处 理 单元 ， 这 个 单元 
既 要 取 指 ， 又 要 译 码 ， 还 要 执行 ， 假 设 上 述 三 种 操作 都 可 以 在 时 间 工 完 
成 ， 那 么 一 条 指令 的 处 理 时间 为 3T，n 条 指令 的 处 理 时 间 就 为 3nT， 但 
是 如 果 我 们 设计 有 三 个 硬件 单元 ， 分 别 做 这 三 项 工作 的 一 项 ， 那 么 就 可 
以 在 执行 的 同时 对 下 一 条 指令 译 码 ， 在 对 下 一 条 指令 译 码 的 同时 还 可 以 
再 取 一 条 指令 ， 这 就 是 经 典 的 三 级 流水 线 ， 如 图 3-1 所 示 。 





























指令 个 

指令 n+2 取 指 | 译 码 | 执行 
指令 n+1 取 指 | 译 码 | 执行 

指令 x | 取 指 | 译 码 | 执行 
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图 3-1 三 级 流水 线 示意 图 


从 图 3-1 可 知 ， 在 三 级 流水 线 上 执行 3 条 指令 所 需 时 间 为 5T， 而 如 采 
没有 使 用 流水 线 则 需要 9T， 流 水 线 确实 加 快 了 指令 执行 。ARM7 采 用 的 
就 是 三 级 流水 线 。 但 世间 是 没有 这 么 简单 完美 的 ， 上 面 假设 取 指 、 译 
码 、 执 行 需要 的 时 间 都 是 IT， 实际 并 非 如 此 ， 比 如 取 指 的 时 间 就 可 能 很 
长 ， 假 设 取 指 需要 2T 时 间 ， 那 么 如 网 3-2 所 示 。 









































指令 
指令 n+2 取 指 译 码 | 执行 
指令 n+1 取 指 PRAY 执行 
指令 n 取 指 PER 执行 
> 
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图 3-2 取 指 时 间 为 2T 时 的 流水 线 工 作 情 况 
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束 ， 此 时 译 码 阶段 、 执 行 阶段 都 停滞 ， 这 样 一 来 自然 就 慢 下 来 ， 最 后 ， 
执行 3 条 指令 所 需 时 间 为 8T。 解 决 取 指 时 间 过 长 的 措施 是 引入 绥 存 
(Cache) ， 处 理 器 从 缓存 读 取 指 令 只 需要 1 个 时 钟 周 期 。 

还 有 一 种 情况 是 执行 阶段 时 间 过 长 ， 比 如 指令 为 加 载 /存储 指令 
(Load/Store) 时 ， 由 于 涉及 访问 存储 器 ， 执 行 阶段 所 需 的 时 间 束 可 能 
大 于 T， 此 时 也 会 导致 流水 线 停 滞 。 为 了 解决 这 种 情况 下 的 流水 线 停 滞 
问题 ， 引 入 了 五 级 流水 线 ， 分 别 是 : 取 指 、 译 码 、 执 行 、 访 存 、 回 写 。 








如 图 3-3 所 示 。 
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图 3-3 五 级 流水 线 示意 
其 中 访 存 阶段 (Memory Access) 的 作用 是 从 存储 器 装载 数据 到 寄 
~ 


存 器 或 者 将 寄存 器 数据 保存 到 存储 器 ， 当 然 ， 如 果 不 是 Load/Store 指 令 
则 不 需要 这 一 步 ， 此 时 在 访 存 阶段 就 只 是 将 执行 阶段 的 运算 结果 送 到 下 
一 级 回 写 阶段 。 回 写 阶段 《Write Back) 的 作用 是 将 数据 写 入 目的 寄存 


器 。ARM9 就 采用 了 这 种 五 级 流水 线 ，OpenMIPS 的 设计 目标 也 是 五 级 
流水 线 。 有 具体 而 言 ， OpenMIPS 五 级 流水 线 各 个 阶段 的 主要 工作 如 下 。 


。 取 指 阶 段 ”从 指令 存储 器 读 出 指令 ， 同 时 确定 下 一 条 指令 地 
Abe 

译 码 阶段 : “对 指令 进行 译 码 ， 从 通用 寄存 器 中 该 出 要 使 用 的 
寄存 器 的 值 ， 如 果 指 令 中 含有 立即 数 ， 那 么 还 要 将 立即 数 进行 
符号 扩展 或 无 符号 扩展 。 如 果 是 转移 指令 ， 并 且 满 足 转移 条 
件 ， 那 么 给 出 转移 目标 ， 作 为 新 的 指令 地 址 。 

执行 阶段 ”按照 译 码 阶段 给 出 的 操作 数 、 运 算 类 型 ， 进 行 运 
算 ， 给 出 运算 结果 。 如 果 是 Load/Store 指 令 ， 那 么 还 会 计算 
Load/Store 的 目标 地 址 。 

访 存 阶段 ，。 如 果 是 Load/Store 指 令 ， 那 么 在 此 阶段 会 访问 数据 
存储 器 ， 反 之 ， 只 是 将 执行 阶段 的 结果 同 下 传递 到 回 写 阶段 。 
同时 ， 在 此 阶段 还 要 判断 是 否 有 异常 需要 人 处理， 如 果 有 ， 那 么 
会 清除 流水 线 ， 然 后 转移 到 异常 处 理 例 程 入 口 地 址 处 继续 执 
行 。 

e 回 写 阶段 : 将 运算 结果 保存 到 目标 寄存 器 。 




















读者 可 能 对 上 述 流水 线 各 个 阶段 的 主要 工作 还 不 完全 理解 ， 没 有 关 
系 ， 本 书 也 不 是 一 次 实现 上 述 全 部 工作 ， 而 是 逐步 完善 ， 一 开始 ， 只 实 
现 流 水 线 各 个 阶段 的 基本 工作 ， 慢 慢 地 丰富 、 完 善 。 


3.1.3 ”指令 执行 周期 


OpenMIPS 设 计 目 标 中 提 到 : 实现 MIPS32 指 令 集中 的 所 有 整数 指 
令 ， 并 且 大 多 数 指令 可 以 在 一 个 时 钟 周期 内 执行 完成 。 具 体 而 言 ， 


OpenMIPS 实 现 的 所 有 指令 执行 完成 需要 的 时 钟 周期 如 表 3-1 所 示 。 


表 3-1 0penMIPS 中 所 有 指令 执行 完成 需要 的 时 钟 周期 





1% 执行 完成 需要 的 时 钟 周期 


乘 累 加 指令 madd、maddu 


对 表 3-1 有 以 下 几 点 说 明 。 





(1) OpenMIPS 计 划 采 用 试 商 法 完成 除法 运算 ， 对 于 32 位 的 除法 ， 
执行 阶段 至 少 需要 32 个 时 钟 周期 ， 再 加 上 一 些 准备 工作 需要 的 时 钟 周 
期 ， 最 后 需要 36 个 时 钟 周期 才能 执行 完成 。 在 第 7 章 “ 算 术 操 作 指 令 的 实 
现 ” 中 会 具体 介绍 除法 指令 的 实现 过 程 。 





(2) 乘 累 加 指令 madd、maddu， 乘 累 减 指令 msub、msubu 都 需要 2 
个 时 钟 周 期 才能 执行 完成 。 主 要 是 因为 这 4 条 指令 都 要 做 两 次 运算 ， 一 
次 乘法 、 一 次 加 /减法 ， 如 果 将 这 两 次 运算 放 在 执行 阶段 的 一 个 时 钟 周 
期 中 完成 ， 那 么 会 使 执行 阶段 所 需要 的 时 间 明 显 增 加 ， 从 而 降低 
OpenMIPS 工 作 时 钟 的 频率 ， 因 此 ，OpenMIPS 设 计 在 执行 阶段 使 用 两 个 
时 钟 周 期 完成 这 4 条 指令 ， 一 个 时 钟 周期 进行 乘法 ， 下 一 个 时 钟 周 期 进 
行 加 /减法 。 在 第 7 章 “ 算 术 操 作 指令 的 实现 ”中 会 具体 介绍 乘 累 加 、 乘 累 
减 指令 的 实现 过 程 。 








3.2 ”教学 版 OpenMIPS 处 理 需 接口 


教学 版 OpenMIPS 人 处 理 占 的 外 部 接口 如 图 3-4 所 示 。 采 用 左边 是 输入 
接口 ， 右 边 是 输出 接口 的 方式 绘制 ， 这 样 比较 直观 ， 便 于 理解 。 各 接口 
的 描述 如 表 3-2 所 示 ， 可 以 分 为 三 类 : 系统 控制 接口 (包括 复位 、 时 
钟 、 中 断 ) 、 指 令 存储 絮 接 口 、 数 据 存 储 右 接口 。 


OpenMIPS (HFW) 











— rst timer_int o —— 





clk rom_ce o [一 一 





rom data 1 rom addr o —— 











ram_data i ram addr 0 —— 
int_i ram _ data o 上 -一 一 
ram_sel_o 


ram We 0 — 


ram ce 0 | 一 一 











图 3-4 ”教学 版 0penMIPS 处 理 器 的 外 部 接口 
表 3-2 教学 版 0penMIPS 处 理 器 外 部 接口 描述 


序 = 接口 名 | 宽度 (bit) | 输入 /输出 
rst 1 输入 
1 





输出 输出 到 指令 存储 器 的 地 址 
输出 指令 存储 器 使 能 信和 
if 从 数据 存储 器 读 取 的 数据 

要 访问 的 数据 在 储 器 的 地 址 

是 否 是 对 数据 存储 器 的 写 操作 ， 为 1 表示 是 写 操作 

















o (msi ja [an E: 
要 写 入 数据 存储 器 的 数据 
11 人 


ram ce o 1 输出 数据 存储 器 使 能 信号 








int i 6 f 6 个 外 部 硬件 中 断 输 入 


12 6 


33 ”文件 说 明 


OpenMIPS 是 五 级 流水 线 人 处理 器 ， 流 水 线 各 个 阶段 的 模块 、 对 应 的 
文件 如 图 3-5 所 示 。 图 中 每 个 模块 的 上 方 标注 的 是 模块 名 ， 下 方 标注 的 
是 对 应 的 文件 名 。 模 块 之 间 的 关系 没有 绘 出 ， 因 为 关系 比较 复杂 ， 在 书 
中 不 便 绘制 ， 读 者 可 以 参考 本 书 光盘 中 的 “openmips 模 块 连接 关系 
图 .vsd” 文 件 ， 其 中 绘制 了 模块 之 间 详 细 的 连接 关系 。 





























































































































CTRL 
trly 
取 指 | PEA 执行 访 存 回 写 
PC IFAD ID ID/EX EX EXIMEM MEM MEM/WB cro 
PC_reg.y cp0_reg.v 
if id.v idv id bxv 5 Taney LLbit 
| | ex_mem.v mem_wb.v 
Regfil i i 
— DIV LLbit_reg.v 
| HILO 
div.v 
regfile.v | hilo_reg.v 


图 3-5 ”0penM1PS 流 水 线 各 个 阶段 的 模块 、 对 应 的 文件 
图 3-5 有 具体 说 明 如 下 。 
(1) 取 指 阶段 


。 PC 模块 : 给 出 指令 地 址 ， 其 中 实现 指令 指针 寄存 器 PC， 该 寄 
存 器 的 值 就 是 指令 地 址 ， 对 应 pc_reg.v 文 件 。 

e IF/ID 模 块 ， 实现 取 指 与 译 码 阶段 之 间 的 寄存 器 ， 将 取 指 阶段 
的 结果 (取得 的 指令 、 指 令 地 址 等 信息 ) 在 下 一 个 时 钟 传递 到 








译 码 阶段 ， 对 应 if_id.v 文 件 。 


(2) 译 码 阶段 





e ID 模块 : 对 指令 进行 译 码 ， 译 码 结果 包括 运算 类 型 、 运 算 所 需 
的 源 操作 数 、 要 写 入 的 目的 寄存 器 地 址 等 ， 对 应 id.v 文 件 。 

e Regfile 模 块 ， 实 现 了 32 个 32 位 通用 整数 寄存 器 ， 可 以 同时 进行 
两 个 寄存 器 的 读 操 作 和 一 个 寄存 器 的 写 操 作 ， 对 应 regfile.v 文 
件 。 

e ID/EX 模 块 ， 实现 译 码 与 执行 阶段 之 间 的 寄存 器 ， 将 译 码 阶段 
的 结果 在 下 一 个 时 钟 周期 传递 到 执行 阶段 ， 对 应 id_ex.v 文 件 。 


(3) 执行 阶段 


EX 模块 : 依据 译 码 阶段 的 结果 ， 进 行 指定 的 运算 ， 给 出 运算 
结果 。 对 心 ex.v 文 件 。 

DIV 模块 : 进行 除法 运算 的 模块 ， 对 应 div.v 文 件 。 
EX/MEM 模 块 : 实现 执行 与 访 存 阶段 之 间 的 寄存 器 ， 将 执行 阶 
段 的 结果 在 下 一 个 时 钟 周 期 传递 到 访 存 阶段 ， 对 应 ex_mem.v 文 
TF 


(4) 访 存 阶段 


e MEM 模 块 : 如 果 是 加 载 、 存 储 指令 ， 那 么 会 对 数据 存储 堪 进 
行 访问 。 此 外 ， 还 会 在 该 模块 进行 异常 判断 。 对 应 mem.v 文 
件 。 

。MEM/WB 模 块 ， 实现 访 存 与 回 写 阶段 之 间 的 寄存 器， 将 访 存 
阶段 的 结果 在 下 一 个 时 钟 周 期 传递 到 回 写 阶段 ， 对 应 
mem_wb.v 文 件 。 





(5) 回 写 阶段 


CP0 模 块 ， 对 应 MIPS 架 构 中 的 协 处 理 器 CP0。 

LLbit 模 块 ， 实现 寄存 器 LLbit， 在 链接 加 载 指令 1、 条 件 存储 指 
令 sc 的 处 理 过 程 中 会 使 用 到 该 寄存 器 ， 第 9 章 会 详 述 。 

HILO 模 块 : 实现 寄存 器 HI、LO， 在 乘法 、 除 法 指令 的 处 理 过 
程 中 会 使 用 到 这 两 个 寄存 器 ， 第 7 章 会 详 述 。 


另外 ， 还 有 一 个 CTRL 模 块 ， 在 图 3-5 的 上 部 单独 画 出 。 这 个 模块 对 
应 ctrl.v 文 件 ， 是 用 来 控制 整个 流水 线 的 暂停 、 清 除 等 动作 ， 所 以 不 便于 
将 其 归 入 流水 线 中 的 某 一 个 阶段 。 


本 书 的 附录 A 给 出 了 各 个 模块 的 接口 示意 图 ， 以 及 接口 的 作用 描 
。 读 者 可 能 会 感觉 模块 太 多 、 每 个 模块 的 接口 也 太 多 ， 似 乎 很 难 理 
， 这 种 担心 是 不 必要 的 ， 之 前 也 所 到 本 书 不 是 一 次 实现 上 述 全 部 模 
， 而 是 首先 实现 其 中 一 部 分 模块 ， 这 一 部 分 模块 也 只 实现 少量 接口 ， 
只 要 能 满足 我 们 的 要 求 即 可 ， 然 后 随 者 OpenMIPS 实 现 的 指令 种 类 越 来 
AS, TEMS, HINA 


FR 


3.4 ”实现 方法 


在 写作 本 书 之 前 ， 已 经 出 现 了 一 些 介绍 软 核 处 理 右 实现 的 书籍 ， 这 
些 书 在 介绍 实现 方法 时 有 一 个 共同 点 : 一 次 考虑 所 有 的 指令 、 所 有 的 情 
况 ， 然 后 给 出 代码 。 笔 者 认为 这 种 方法 读者 不 易于 接受 ， 而 且 这 也 不 是 
作者 实现 处 理 器 时 采用 的 方法 。 在 本 书 中 ， 笔 者 借鉴 了 软件 开发 中 
的 “ 增 量 模型 概念 ， 使 用 了 一 种 完全 不 同 的 实现 方法 : 先 考虑 最 简单 的 
情况 ， 给 出 代码 ， 然 后 考虑 稍微 多 一 点 的 情况 ， 修 改 、 补 充 代 码 ， 随 着 
考虑 情况 的 增多 ， 不 停 地 修改 、 补 充 人 代码， 最终， 使 代码 实现 需求 ， 同 
时 ， 也 符合 读者 的 认识 过 程 。 








在 第 4 章 中 ， 我 们 就 考虑 了 一 种 最 简单 的 情况 一 一 只 实现 一 条 指 
令 ， 这 条 指令 是 逻辑 “或 ”指令 ori， 借 助 这 条 指令 ， 可 以 搭建 OpenMIPS 
流水 线 的 结构 ， 此 时 的 数据 流 图 如 图 3-6 所 示 。 读 者 暂时 不 用 理解 其 具 
体 含义 ， 只 需 与 图 3-7 对 比 ， 体 会 各 目的 复杂 上 度 ， 有 具体 含义 会 在 第 4 章 介 
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图 3-6 只 实现 一 条 指令 ori 时 的 数据 流 图 


在 后 续 革 节 中 我 们 依次 实现 逻辑 操作 指令 、 移 位 操作 指令 、 空 指 
令 、 移 动 操 作 指 令 、 算 术 操 作 指令 、 转 移 指令 、 加 载 存储 指令 、 协 处 理 
虱 访 问 指令 、 寞 和 常 相关 指令 ， 最 终 实 现 MIPS32 指 令 集 架构 中 定义 的 所 
有 整数 指令 ， 此 时 的 数据 流 图 如 图 3-7 所 示 。 同 样 ， 读 者 此 时 暂 不 用 理 
解 其 具体 含义 ， 只 需 与 图 3-6 对 比 ， 体 会 各 自 的 复杂 度 。 
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23-7 实现 MIPS32 指 令 集 中 所 有 整数 指令 之 后 的 数据 流 图 





对 比 图 3-6、 图 3-7， 会 发 现 复杂 上 度 大 大 增加 ， 如 果 笔 者 一 开始 束 考 
虚实 现 图 3-7 所 示 的 数据 流 图 ， 那 么 读者 需要 知道 MIPS32 指 令 集 中 定义 
的 所 有 指令 ， 还 要 理解 其 作用 。 显 然 会 增加 理解 难度 。 更 好 的 方法 是 ， 
一 开始 只 考虑 图 3-6 所 示 的 数据 流 图 ， 读 者 只 需要 理解 指令 ori 的 作用 ， 
然后 一 步 步 添 加 实现 更 多 指令 ， 同 时 丰富 完善 数据 流 图 ， 最 终 实现 图 3- 
7 所 示 的 数据 流 图 。 比 如 : 在 添加 实现 转移 指令 的 时 候 ， 就 会 为 图 3-6 数 
气流 图 中 的 译 码 阶段 增加 “转移 判断 ”模块 ， 在 添加 实现 异常 相关 指令 的 
时 候 ， 束 会 为 图 3-6 数 据 流 图 中 的 访 存 阶段 增加 “异常 判断 ”模块 。 








以 上 就 是 本 书 在 实现 OpenMIPS 处 理 器 时 采用 的 实现 方法 ， 第 4 章 将 
实现 最 小 结构 ， 即 只 考虑 执行 一 条 指令 ori。 


第 4 草 ”第 一 条 指令 or i 的 实现 


前 面 儿童 介绍 了 很 多 预备 知识 ， 也 描绘 了 即将 要 实现 的 OpenMIPS 
处 理 器 的 蓝图 ， 各 位 读者 是 不 是 早已 摩拳擦掌 ， 迫 切 希 望 一 展 身手 了 ， 
好 吧 ， 本 章 我 们 将 实现 OpenMIPS 处 理 器 的 第 一 条 指令 ori， 为 什么 选择 
这 条 指令 作为 我 们 实现 的 第 一 条 指令 呢 ?” 管 案 就 两 个 字 一 一 人 简单， 指令 
ori 用 来 实现 逻辑 “或 ?运算 ， 选 择 一 条 简单 的 指令 有 助 于 我 们 排除 干扰 ， 
将 注意 力 集中 在 流水 线 结构 的 实现 上 ， 当 然 也 可 以 选择 其 他 类 似 的 指 
令 ， 只 要 简单 即 可 。 通 过 这 条 简单 指令 的 实现 ， 本 章 在 4.2 市 将 初步 建 
OpenMIPS 的 五 级 流水 线 结构 ， 当 我 们 在 后 面 章节 中 实现 其 余 指 令 的 
时 候 ， 都 是 在 这 个 初步 建立 的 流水 线 结构 上 进行 扩充 。 























在 ori 指 令 实 现 后 ， 要 验证 其 实现 是 否 正 确 ， 所 以 在 4.3 节 建立 了 最 
小 SOPC， 仅 仅 包含 OpenMIPS、 指 令 存 储 器 ， 用 于 验证 ori 指 令 是 否 实现 
正确 ， 后 续 章 市 验证 其 余 指令 的 时 候 ， 都 是 在 这 个 最 小 SOPC 或 者 其 改 
进 模型 上 进行 验证 的 。 


本 章 最 后 介绍 了 MIPS 编 译 环境 的 建立 。 


41 ori 指 令 说 明 


ori 是 进行 逻辑 “或 ”运算 的 指令 ， 其 指令 格式 如 图 4-1 所 示 。 


31 26 25 21 20 16 15 0 





ORI 


001101 rs rt immediate 




















图 4-1 ”ori 指令 格式 


从 指令 格式 中 可 以 知道 ， 这 是 一 个 I 类 型 的 指令 ，ori 指 令 的 指令 码 
是 6b001101， 所 以 当 处 理 器 发 现 正在 处 理 的 指令 的 高 6bit 是 6b001101 
时 ， 就 知道 当前 正在 处 理 的 是 ori 指 令 。 





指令 用 法 为 : ori rs，rt，immediate， 作 用 是 将 指令 中 的 16 位 立即 数 
immediate 进 行 无 符号 扩展 伴 32 位 ， 然 后 与 夫 引 为 rs 的 通用 寄存 器 的 值 进 
行 逻辑 “或 ?运算 ， 运 算 结果 保存 到 索引 为 rt 的 通用 寄存 器 中 。 这 里 需要 
说 明 以 下 两 点 。 





(1) 无 符号 扩展 


在 MIPS32 指 令 集 架 构 中 ， 经 常会 有 指令 需要 将 其 中 的 立即 数 进行 
符号 扩展 ， 或 者 无 符号 扩展 ， 一 般 都 是 将 n 位 立即 数 扩展 为 32 位 ， 其 
中 ， 符 号 扩展 是 将 n 位 立即 数 的 最 高 位 复制 到 扩展 后 的 32 位 数据 的 高 
(32-n) 位 ， 无 符号 扩展 则 是 将 扩展 后 的 32 位 数据 的 高 (32-n) 位 都 置 
为 0。 以 将 指令 中 的 16 位 立即 数 扩 展 为 32 位 为 例 ， 表 4-1 给 出 了 当 16 位 并 
即 数 分 别 是 0x8000、0x1000 时 的 符号 扩展 、 无 符号 扩展 的 结 

















表 4-1 16 位 立即 数 扩 展 举 例 





16 位 立即 数 0x8000 0x1000 
符号 扩展 OxFFFF8000 0x00001000 
无 符号 扩展 0x00008000 0x00001000 


(2) 通用 寄存 器 


I 
Il 


在 MIPS32 指 令 集 架构 中 定义 了 32 个 通用 寄存 器 $0-$31，OpenMIPS 
实现 了 这 32 个 通用 寄存 器 ， 使 用 某 一 个 通用 寄存 器 只 需要 给 出 相应 索 
引 ， 这 个 索引 占用 5bit，ori 指 令 中 的 rs、rt 就 是 通用 寄存 器 的 索引 ， 例 
如 : 当 rs 为 5b00011 时 ， 就 表示 通用 寄存 器 $3。 


4.2 ”注水 线 结构 的 建立 
42.1 流水 线 的 简单 模型 


数字 电路 有 组 合 逻 辑 、 时 序 逻 辑 之 分 ， 其 中 时 序 逻 辑 最 基本 的 器 件 
是 寄存 器 ， 此 处 的 寄存 器 不 是 在 4.1 节 中 提 到 的 MIPS 架 构 规定 的 通用 寄 
存 器 $0-$31， 后 者 是 一 个 更 高 层面 的 概念 ， 前 者 是 类 似 于 D 触 发 器 这 种 
数字 电路 的 基本 器 件 。 寄 存 右 按照 给 定时 间 脉 冲 来 进行 时 序 同步 操作 ， 
其 使 得 时 序 逻 辑 电路 具有 记忆 功能 。 而 组 合 逻 辑 电路 则 由 逻辑 门 组 成 ， 
提供 电路 的 所 有 逻辑 功能 。 实 际 的 数字 电路 一 般 是 组 合 逻 辑 与 时 序 逻 辑 
的 结合 。 如 果 寄 存 器 的 输出 问 和 输入 端 存在 环 路 ， 这 样 的 电路 称 为 “ 状 
态 机 ”。 状 态 机 的 简单 模型 如 图 4-2 所 示 。 如 果 寄 存 器 之 间 有 连接 ， 而 没 
有 上 述 环 路 ， 这 样 的 电路 结构 称 为 “流水 线 ”?。 流 水 线 的 简单 模型 如 图 4- 
3 所 示 。 
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图 4-3 流水 线 的 简单 模型 





在 流水 线 结构 中 ， 信 和 号 在 寄存 器 之 间 传 递 ， 每 传递 到 一 级 都 会 引起 


相应 的 组 合 多 辑 电路 变化 ， 对 这 种 模型 进行 抽象 描述 就 是 寄存 器 传输 级 
CRegister Transfer Level, RTL) 。 本 节 接 下 来 要 实现 的 原始 的 
OpenMIPS 五 级 流水 线 结构 就 是 图 4-3 的 扩充 。 


4.2.2 ”原始 的 OpenMIPS 五 级 流水 线 
结构 


扩充 图 4-3， 可 以 得 到 OpenMIPS 的 原始 数据 流 图 ， 如 图 4-4 所 示 。 这 
个 数据 流 图 还 很 不 完整 ， 在 后 续 章节 中 会 随 着 实现 指令 的 增加 而 丰富 ， 
但 这 个 原始 的 数据 流 图 已 经 可 以 表达 本 节 要 实现 的 ori 指 令 在 流水 线 中 的 
处 理 过 程 了 。 
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图 4-4 原始 的 数据 流 图 


图 中 深 色 部 分 对 应 的 是 图 4-3 中 的 D 触 发 器 ， 深 色 部 分 之 间 的 部 分 对 
应 的 是 图 4-3 中 的 组 合 逻 辑 。 各 个 阶段 完成 的 主要 工作 如 下 。 


e tts: 取出 指令 存储 器 中 的 指令 ，PC 值 递增 ， 准 备 取 下 一 条 


指令 。 
o 译 码 : 对 指令 进行 诺 码 ， 依 据 译 码 结 末 ， 从 32 个 通用 寄存 器 中 
取出 源 操作 数 ， 有 的 指令 要 求 两 个 源 操作 数 都 是 寄存 器 的 值 ， 
比如 or 指令 ， 有 的 指令 要 求 其 中 一 个 源 操作 数 是 指令 中 立即 数 
的 扩展 ， 比 如 ori 指 令 ， 所 以 这 里 有 两 个 复 用 器 ， 用 于 依据 指令 
要 求 ， 确 定 参 与 运算 的 操作 数 ， 最 终 确定 的 两 个 操作 数 会 送 到 
执行 阶段 。 
执行 阶段 :依据 译 码 阶段 送 入 的 源 操作 数 、 操 作 码 ， 进 行 运 
算 ， 对 于 ori 指 令 而 言 ， 就 是 进行 逻辑 “或 "运算 ， 运 算 结果 传递 
到 访 存 阶段 。 
。 访 存 阶 段 : 对 于 ori 指 令 ， 在 访 存 阶段 没有 任何 操作 ， 和 直接 将 运 
算 结果 问 下 传递 到 回 写 阶段 。 
© 回 写 阶段 : 将 运算 结果 保存 到 目的 寄存 需 。 








图 4-5 是 为 实现 上 述 数据 流 图 而 设计 的 OpenMIPS 五 级 流水 线 系统 结 
构图 ， 图 中 显示 了 各 个 模块 的 接口 、 连 接 关 系 。 每 个 模块 上 方 是 模块 
名 ， 下 方 是 对 应 的 Verilog HDL 程序 文件 名 。 本 章 的 4.2.4 一 4.2.8 节 将 分 
别 介绍 图 中 各 个 模块 的 实现 。 
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图 4-5 ”原始 的 0penMIPS 五 级 流水 线 系 统 结构 图 


4.2.3 ”一 些 宏 定义 





在 正式 开始 介绍 流水 线 结构 实现 之 前 ， 需 要 给 出 一 些 宏 定义 ， 因 为 
在 OpenMIPS 的 实现 过 程 中 ， 为 了 提高 代码 的 可 读 性 和 易 民 性， 使 用 了 
较 多 的 宏 ， 全 部 的 宏 都 在 文件 defines.v 中 定义 。 此 处 列举 在 本 章 中 会 使 
用 的 一 部 分 宏 ， 后 面 随 着 OpenMIPS 功 能 的 不 断 完 善 ， 会 有 更 多 的 宏 添 
加 进来 ， 届 时 会 对 新 增加 的 宏 进行 说 明 。 





/类 类 大火 类 类 火炎 火炎 类 火 类 火 类 类 类 全 局 的 实 定 义 Do E E E E SE E SS 
“define RstEnable 1'b1 // 复 位 信号 有 效 
“define RstDisable 1'b0 // 复 位 信号 无 效 
‘define Zeroword 32'h00000000 //32 位 的 数值 0 
‘define WriteEnable eal // 使 能 写 

“define WriteDisable 1'b0 E 

“define ReadEnable 1'b1 // 使 能 读 

“define ReadDisable 1'b0 // 禁 止 读 

“define AluOpBus 7:0 // 译 码 阶 段 的 输出 all 
‘define AluSelBus 2:0 // 译 码 阶段 的 输出 al 
“define InstValid 1'b0 // 指 令 有 效 
“define InstInvalid 1'b1 // 指 令 无 效 
“define True_v 1'b1 EE MR" 
“define False_v 1'b0 // 逻 辑 “ 假 ” 
‘define ChipEnable 1'b1 IIS Fr AGERE 


“define ChipDisable 1'b0 // 蕊 片 禁 止 





“define 
“define 
“define 
“define 
“define 


“define 


Regwidth 
DoubleRegwidth 
DoubleRegBus 
RegNum 
RegNumLog2 
NOPRegAddr 


32 // 通 用 寄存 器 的 宽度 


64 // 两 倍 的 通用 寄存 器 
63:0 // 两 倍 的 通用 寄存 器 上 
32 // 通 用 寄存 器 的 数量 
5 // 寻 址 通用 寄存 器 使 用 
5'b00000 


4.2.4 取 指 阶段 的 实现 


取 指 阶段 取出 指令 存储 器 中 的 指令 ， 同 时 ，PC 值 递增 ， 准 备 取 下 
一 条 指令 ， 包 括 PC、IF/ID 两 个 模块 。 


1. PC 模块 


PC 模块 的 作用 是 给 出 指令 地 址 ， 其 接口 描述 如 表 4-2 所 示 。 


表 4-2 PC 模块 的 接口 描述 


wa 


要 读 取 的 指令 地 址 








指令 存储 器 使 能 信号 


PC 模块 对 应 的 源 文件 是 pc_reg.v， 代 码 如 下 ， 可 以 在 本 书 附带 光盘 
的 Code\Chapter 人 目录 下 找到 源 文 件 。 读 者 可 以 使 用 任何 文本 编辑 工具 
编辑 该 文件 ， 笔 者 习惯 使 用 UltraEdit， 所 有 的 代码 都 是 使 用 它 编 辑 的 ， 
当然 也 可 以 使 用 Windows 自 带 的 记事 本 。 


module pc_reg( 


其 中 使 用 到 了 一 些 define.v 中 定义 的 宏 ，InstAddrBus 宏 表示 指令 地 
址 线 的 宽度 ， 此 处 定义 为 32，RstEnable 宏 表示 复位 信号 有 效 ， 定 义 为 
1b1， 也 就 是 当 输入 rst 为 高 电 乎 时 ， 表 示 复 位 信号 有 效 。 








在 复位 的 时 候 ， 输 出 的 指令 存储 融 使 能 信号 为 ChipDisable， 表 示 指 
令 存 储 器 茶 用 ， 其 余 时 刻 指令 存储 露 使 能 信号 为 ChipEnable， 表 示 指 令 
FF NE ARIE BE o 


当 指 令 存 储 器 禁用 时 ，PC 的 值 保持 为 0， 当 指令 存储 器 能 使 用 时 ， 
PC 的 值 会 在 每 时 钟 周 期 加 4， 表 示 下 一 条 指令 的 地 址 ， 因 为 一 条 指令 是 
32 位 ， 而 我 们 设计 的 OpenMIPS 是 可 以 按照 字 节 寻 址 的 ， 一 条 指令 对 应 4 
个 字 节 ， 所 以 PC 加 4 指 回 下 一 条 指令 地 址 。 读 者 需要 注意 区 分 : 在 2.7 节 
设计 的 简单 取 指 电路 是 按照 字 寻 址 的 ， 所 以 每 时 钟 周期 PC 加 1。 


2. IF/ID 模 块 


IF/ID 模 块 的 作用 是 暂时 保存 取 指 阶段 取得 的 指令 ， 以 及 对 应 的 指 
令 地 址 ， 并 在 下 一 个 时 钟 传递 到 译 码 阶段 ， 其 接口 描述 如 表 4-3 所 示 。 





表 4-3 1F/1D 模 块 的 接口 描述 


序 号 | 接口 名 宽度 (bit) 输入 /输出 
1 rst 1 输 

2; clk 输 
E 








TE 
3 if pe 输 淖 阶 段 取得 的 指令 对 应 的 地 址 
输 x 指 阶段 取得 的 指令 
全 出 泽 码 阶段 的 指令 对 应 的 地 址 


IF/ID 模 块 对 应 的 源 代码 文件 是 if_id.v， 代 码 如 下 ， 读 者 可 以 在 本 书 
附带 光盘 的 Code\Chapter4\ 目 录 下 找到 源 文件 。 

















module if_id( 
input wire clk, 


input wire rst, 





从 代码 可 以 知道 ， 其 中 只 有 一 个 时 序 电路 ，IF/ID 模 块 只 是 简单 地 
将 取 指 阶段 的 结果 在 每 个 时 钟 周期 的 上 升 沿 传递 到 译 码 阶段 。 


4.2.5 详 码 阶段 的 实现 


参考 图 4-5 可 知 ，IF/ID 模 块 的 输出 连接 到 ID 模 块 ， 那 么 ， 我 们 的 指 
令 此 时 已 经 进入 译 码 阶段 ， 在 此 阶段 ， 将 对 取 到 的 指令 进行 译 码 : 给 出 
要 进行 的 运算 类 型 ， 以 及 参与 运算 的 操作 数 。 译 码 阶段 包括 Regfile、ID 
和 ID/EX 三 个 模块 。 


1. Regfile 模 块 


Regfile 模 块 实现 了 32 个 32 位 通用 整数 寄存 器 ， 可 以 同时 进行 两 个 寄 
存 器 的 读 操 作 和 一 个 寄存 器 的 写 操 作 ， 其 接口 描述 如 表 4-4 所 示 。 


表 4-4 Regfile 模 块 接口 描述 表 


CECE IN 


俞 出 的 寄存 器 值 

i 读 取 的 寄存 器 的 地 址 
使 能 信号 

全 出 的 寄存 器 值 















































Regfile 模 块 对 应 的 源 代码 文件 是 regfile.v， 代 码 如 下 ， 可 以 在 本 书 
附带 光盘 的 Code\Chapter4\ 目 录 下 找到 regfile.v 文 件 。 


module regfile( 
input wire clk, 


input wire rst, 











Regfile 模 块 可 以 分 为 四 段 进行 理解 。 


(1) 第 一 段 : 定义 了 一 个 二 维 的 向 量 ， 元 素 个 数 是 RegNum， 这 是 
在 defines.v 中 的 一 个 宏 定 义 ， 为 32， 每 个 元 素 的 宽度 是 RegBus， 这 也 是 
在 defines.v 中 的 一 个 宏 定 义 ， 也 为 32， 所 以 此 处 定义 的 就 是 32 个 32 位 寄 
TTAF o 

(2) BIR: 实现 了 写 寄存 器 操作 ， 当 复位 信和 号 无 效 时 〈rst 为 
RstDisable) ， 在 写 使 能 信号 we 有 效 〈we 为 WriteEnable) ， 且 写 操作 目 








的 寄存 器 不 等 于 0 的 情况 下 ， 可 以 将 写 输入 数据 保存 到 目的 寄存 右 。 之 
所 以 要 判断 目的 寄存 器 不 为 0， 是 因为 MIPS32 架 构 规定 $0 的 值 只 能 为 

0， 所 以 不 要 写 入 。WiriteEnable 是 defines.v 中 定义 的 宏 ， 表 示 写 使 能 信号 
有 有效， 这些 宏 定 义 的 含义 十 分 明显 ， 从 名 称 上 就 可 以 知道 具体 含义 ， 所 
以 本 书后 面 对 宏 定义 不 再 作出 说 明 ， 除 非 这 个 宏 定 义 的 含义 从 名 称 上 不 


„MH. 











(3) 第 三 段 : 实现 了 第 一 个 读 寄 存 器 端口 ， 分 以 下 几 步 依次 判 


斯: 


当 复 位 信号 有 效 时 ， 第 一 个 读 寄存 右 端 口 的 输出 始终 为 0; 

当 复 位 信号 无 效 时 ， 如 果 读 取 的 是 $60， 那么 直接 给 出 0; 

如 果 第 一 个 读 寄 存 器 端口 要 读 取 的 目标 寄存 器 与 要 写 入 的 目的 
寄存 器 是 同一 个 寄存 器 ， 那 么 直接 将 要 写 入 的 值 作 为 第 一 个 读 
寄存 器 端口 的 输出 ; 

如 果 上 述 情况 都 不 满足 ， 那 么 给 出 第 一 个 读 寄 存 器 端口 要 读 取 
的 目标 寄存 器 地 址 对 应 寄存 器 的 值 ; 

第 一 个 读 寄存 器 端口 不 能 使 用 时 ， 直 接 输出 0。 








(4) 第 四 段 : 实现 了 第 二 个 读 寄存 需 端 口 ， 具 体 过 程 与 第 三 段 是 


相似 的 ， 





不 再 重复 解释 。 


注意 一 点 : 读 寄存 器 操作 是 组 合 逻 辑 电 路 ， 也 就 是 一 旦 输入 的 要 读 
取 的 寄存 器 地 址 raddr1 或 者 raddr2 发 生变 化 ， 那 么 会 立即 给 出 新 地 址 对 
应 的 寄存 器 的 值 ， 这 样 可 以 保证 在 译 码 阶段 取得 要 读 取 的 寄存 器 的 值 ， 
而 写 寄 存 器 操作 是 时 序 多 辑 电路 ， 写 操作 发 生 在 时 钟 信号 的 上 升 沿 。 


2. ID 模块 





ID 模块 的 作用 是 对 指令 进行 译 码 ， 得 到 最 终 运算 的 类 型 、 子 类 型 、 
源 操作 数 1、 源 操作 数 2、 要 写 入 的 目的 寄存 器 地 址 等 信息 ， 其 中 运算 类 
limit 移 位 运算 、 算 术 运 算 等 ， 子 类 型 指 的 是 更 加 详细 的 

运算 类 型 ， 比 如 : iz camden 运算 子 类 型 可 以 是 逻 
辑 “ 或 运算、 逻辑 “与 运算 、 人 逻辑 “ 异 或 ”运算 等 。ID 模 块 的 接口 描述 如 
表 4-5 所 示 。 








表 4-5 ”1D 模块 的 接口 描述 


CEEA AE ea 


1 TSt 输入 复位 信号 
2 pe i 32 输入 但 阶段 的 指令 对 应 的 地 址 


CO wee [ame em EA U 
从 Regfile 输入 的 第 二 个 读 寄存 器 端口 的 输入 





regl addr o 


In Y_ -个 ;南安 
cd ale: , 
reg2 _Iead I Regfile 模 N 第 ~ER fir ii 
输出 i 


Regfile Hi 
reg2 addr o | 5 mil Regfile 模块 的 第 二 个 读 寄 














aluop_o Mili 役 的 指令 要 进行 的 运算 的 子 类 型 
ETE 从 出 洋 码 阶段 的 指 运算 的 源 操作 数 1 
一 TT 









































ID 模 块 对 应 的 代码 文件 是 id.v， 其 内 容 如 下 ， 可 以 在 本 书 附带 光盘 
的 Code\Chapter 人 目录 下 找到 源 文件 。 


module id( 
input wire rst, 
input wire[ InstAddrBus] pc_i, 


input wire[ InstBus] inst_i, 

















end else begin 
reg2 0 <= "ZeroWord; 
end 


end 


endmodule 


IDRE A RE ZH HE, Ah A 4-5) SID BR AG 
Regfile 模 块 也 有 接口 连接 。 其 代码 可 以 分 为 三 段 进行 理解 。 


(1) 第 一 段 : 实现 了 对 指令 的 译 码 ， 依 据 指令 中 的 特征 字段 区 分 
指令 ， 对 指令 ori 而 言 ， 只 需 通 过 识别 26-31bit 的 指令 码 是 否 头 
6b001101， 即 可 判断 是 否 是 ori 指 令 ， 其 中 的 宏 定 义 EXE_ORI 就 是 
6'b001101，op 就 是 指令 的 26-31bit， 所 以 当 op 等 于 EXE_ORI 时 ， 就 表示 
是 ori 指 令 ， 此 时 会 有 以 下 译 码 结果 。 








。 要 读 取 的 寄存 器 情况 : ori 指 令 只 需要 读 取 rs 寄存 器 的 值 ， 默 认 
通过 Regfile 访 端口 1 读 取 的 寄存 器 地 址 regl_addr_o 的 值 是 指令 
的 21-25bit， 参 考 图 4-1 可 知 ， 正 是 ori 指 令 中 的 rr， 所 以 设置 
reg1_read_0 为 1， 通 过 图 4-5 可 以 看 出 ，reg1_read_o 连 接 Regfile 
的 输入 rel，reg1_addr_o 连 接 Regfile 的 输入 raddr1， 结 合 对 
Regfile 模 块 的 介绍 可 知 ， 译 码 阶段 会 读 取 寄 存 器 rs 的 值 。 指 令 
or 需要 的 另 一 个 操作 数 是 立即 数 ， 所 以 设置 reg2_read_o 为 0， 
表示 不 通过 Regfile 读 端口 2 读 取 寄 存 器 ， 这 里 暗含 使 用 立即 数 
作为 运算 的 操作 数 。imm 就 是 指令 中 的 立即 数 进行 零 扩 展 后 的 
值 。 

。 要 执行 的 运算 : alusel_o 给 出 要 执行 的 运算 类 型 ， 对 于 ori 指 令 
而 言 就 是 逻辑 操作 ， 即 EXE_RES_LOGIC。aluop_o 给 出 要 执行 








的 运算 子 类 型 ， 对 于 ori 指 令 而 言 就 是 逻辑 “或 ?运算 ， 即 
EXE_OR_OP。 这 两 个 值 会 传递 到 执行 阶段 。 

要 写 入 的 目的 寄存 器 : wreg_o 表 示 是 否 要 写 目 的 寄存 器 ，ori 指 
令 要 将 计算 结果 保存 到 寄存 器 中 ， 所 以 wreg_o 设 置 为 
WriteEnable。wd_o 是 要 写 入 的 目的 寄存 器 地 址 ， 此 时 就 是 指 
令 的 16-20bit， 参 考 图 4-1 可 知 ， 正 是 ori 指 令 中 的 rt。 这 两 个 值 
也 会 传递 到 执行 阶段 。 














(2) 第 二 段 : 给 出 参与 运算 的 源 操作 数 1 的 值 ， 如 果 reg1_read_o 为 
1， 那 么 就 将 从 Regfile 模 块 读 端 口 1 读 取 的 寄存 器 的 值 作 为 源 操作 数 1， 
如 采 regl_read_o 为 0， 那 么 就 将 立即 数 作为 源 操作 数 1， 对 于 ori 而 言 ， 此 
处 选择 从 Regfile 模 块 读 端口 1 读 取 的 寄存 器 的 值 作为 源 操作 数 1。 该 值 将 
通过 regl_o 端 口 被 传递 到 执行 阶段 。 








(3) 第 三 段 : 给 出 参与 运算 的 源 操作 数 2 的 值 ， 如 果 reg2_read_o 为 
1， 那 么 就 将 从 Regfile 模 块 读 端 口 2 读 取 的 寄存 器 的 值 作 为 源 操作 数 2， 
如 采 reg2_read_o 为 0， 那 么 就 将 立即 数 作为 源 操作 数 2， 对 于 ori 而 言 ， 此 
处 选择 立即 数 imm 作 为 源 操作 数 2。 该 值 将 通过 reg2_o 端 口 被 传递 到 执行 
阶段 。 





3. ID/EX 模 块 
参考 图 4-5 可 知 ，ID 模 块 的 输出 连接 到 ID/EX 模 块 ， 后 者 的 作用 是 将 


译 码 阶段 取得 的 运算 类 型 、 源 操作 数 、 要 写 的 目的 寄存 器 地 址 等 结果 ， 
在 下 一 个 时 钟 传递 到 流水 线 执行 阶段 。 其 接口 描述 如 表 4-6 所 示 。 





表 4-6 1D/EX 模 块 的 接口 描述 


作 A | 


执行 阶段 的 指令 要 进行 的 运算 的 类 型 
执行 阶段 的 指令 要 进行 的 运算 的 源 操作 数 2 


执行 阶段 的 指令 要 写 入 的 目的 寄存 器 地 址 


执行 阶段 的 指令 是 否 有 要 写 入 的 目的 寄存 器 





ID/EX 模 块 对 应 的 代码 文件 是 id_ex.v ， 其 内 容 如 下 ， 可 以 在 本 书 附 
带 光盘 的 Code\Chapter 人 目录 下 找到 源 文件 。 








endmodule 


代码 十 分 清晰 ， 其 中 只 有 一 个 时 序 电 路 ，ID/EX 模 块 只 是 简单 地 将 
译 码 阶段 的 结果 在 时 钟 周期 的 上 升 沿 传递 到 执行 阶段 。 执 行 阶段 将 依据 


这 些 值 进行 运算 。 


4.2.6 ”执行 阶段 的 实现 


现在 ， 指 令 已 经 进入 流水 线 的 执行 阶段 了 ， 在 此 阶段 将 依据 译 码 阶 
段 的 结果 ， 对 源 操作 数 1、 源 操作 数 2， 进 行 指定 的 和 运算。 执行 阶段 包括 
EX、EX/MEM 两 个 模块 。 


1. EX 模块 


观察 图 4-5 中 ID/EX 与 EX 模块 的 端口 连接 关系 可 知 ，EX 模 块 会 从 
ID/EX 模 块 得 到 运算 类 型 alusel_ i、 运 算 子 类 型 aluop_i、 源 操作 数 
reg1l i、 源 操作 数 reg2 i、 要 写 的 目的 寄存 器 地 址 wd_i。EX 模 块 会 依据 
这 些 数据 进行 运算 ， 其 接口 描述 如 表 4-7 所 示 。 











表 4-7 EX 模块 的 接口 描述 


| 输入 ”| 是 否 有 要 写 入 的 目的 寄存 器 


是 
| 输出 | 执行 阶段 的 指令 最 终 要 写 入 的 目的 寄存 器 地 址 


执行 阶段 的 指令 最 终 是 否 有 要 写 入 的 目的 寄存 器 


Am 
输 





EX 模块 对 应 的 代码 文件 为 ex.v， 其 内 容 如 下 ， 可 以 在 本 书 附带 光盘 
的 Code\Chapter 人 目录 下 找到 源 文 件 。 











case ( alusel_i ) 
"EXE_RES_LOGIC: begin 
wdata_o <= logicout; // wdata_o 中 存放 运算 结果 
end 
default: begin 
wdata_o <= ~Zeroword; 
end 
endcase 


end 


endmodule 


EX 模块 中 都 是 组 合 逻 辑 电路 ， 上 述 代 人 码 可 以 分 为 两 段 理解 。 


(1) 第 一 段 : 依据 输入 的 运算 子 类 型 进行 运算 ， 这 里 只 有 一 种 ， 
罗 辑 “或 ”运算 ， 运 算 结 果 保 存在 logicout 中 ， 这 个 变量 专门 用 来 保存 
逻辑 操作 的 结果 ， 以 后 还 会 添加 算术 运算 、 移 位 运算 等 ， 届 时 ， 会 定义 
一 些 新 的 变量 保存 对 应 的 运算 结 

















(2) 第 二 段 : 给 出 最 终 的 运算 结果 ， 包 括 是 否 要 写 目 的 寄存 器 
wreg_0、 要 写 的 目的 寄存 器 地 址 wd_o、 要 写 入 的 数据 wdata_o。 其 中 
wreg_0、wd_o 的 值 都 直接 来 自 译 人 码 阶段 ， 不 需要 改变 ，wdata_o 的 值 要 
依据 运算 类 型 进行 选择 ， 如 果 是 逻辑 运算 ， 那 么 将 logicout 的 值 赋 给 
wdata 0。 此 处 实际 上 是 为 以 后 扩展 做 准备 ， 当 添加 其 他 类 型 的 指令 
时 ， 只 需要 修改 这 里 的 case 情 况 即 可 。 








参考 图 4-5 可 知 ，EX 模 块 的 输出 连接 到 EX/MEM 模 块 ， 后 者 的 作用 
是 将 执行 阶段 取得 的 运算 结果 ， 在 下 一 个 时 钟 传递 到 流水 线 访 存 阶 段 ， 
其 接口 描述 如 表 4-8 所 示 。 


表 4-8 EX/MEM 模 块 的 接口 描述 


阶段 的 指令 执行 后 要 写 入 的 目的 寄存 器 地 址 
ex wreg :阶段 的 指令 执行 后 是 否 有 要 写 入 的 目的 寄存 器 
ex_wdata 32 f -阶段 的 指令 执行 后 要 写 入 目的 寄存 器 的 值 


4 
mem wd 输出 阶段 的 指令 要 写 入 的 目的 寄存 器 地 址 
1 





























mem wreg 阶段 的 指令 是 否 有 要 写 入 的 目的 寄存 器 
A 





mem wdata | 3 :阶段 的 指令 要 写 入 目的 寄存 器 的 值 














EX/MEM 模 块 对 应 的 代码 文件 是 ex_mem.v， 内 容 如 下 ， 可 以 在 本 书 
附带 光盘 的 Code\Chapter4\ 目 录 下 找到 源 文件 。 


module ex_mem( 


input wire clk, 


input wire rst, 


// 来 自 执 行 阶段 的 信息 


input wire[ RegAddrBus] ex_wd, 
input wire ex_wreg, 
input wire[ RegBus ] ex_wdata, 


// 送 到 访 存 阶段 的 信息 
output reg[ 'RegAddrBus] mem_wd, 





十 分 简单 ， 其 中 只 有 一 个 时 序 多 辑 电路 ， 在 时 钟 上 升 沿 ， 将 执行 阶 
段 的 结果 传递 到 访 存 阶段 。 


4.2.7 访 存 阶段 的 实现 


现在 ，ori 指 令 进入 访 存 阶段 了 ， 但 是 由 于 ori 指 令 不 需要 访问 数据 
存储 器 ， 所 以 在 访 存 阶段 ， 不 做 任何 事 ， 只 是 简单 地 将 执行 阶段 的 结果 
回回 写 阶 段 传 递 即 可 。 


流水 线 访 存 阶段 包括 MEM、MEM/WB 两 个 模块 。 
1. MEM 模 块 


MEM 模 块 的 接口 描述 如 表 4-9 所 示 。 


表 4-9 ”MEM 模块 的 接口 描述 


i > 


号 | 接 ie 作 用 | 
ma fo Tan | 


wdi 访 存 阶 段 的 指令 要 写 入 的 目的 寄存 器 地 址 





ON 
Ee eT 


MEM 模 块 的 代码 位 于 文件 nem.v， 内 容 如 下 ， 可 以 在 本 书 附 带 光 盘 
的 Code\Chapter 人 目录 下 找到 源 文件 。 








a _ 
5 
i 1 
wdatai | 32 输入 访 存 阶 段 的 指令 要 写 入 目的 寄存 器 的 值 
1 
32 




















MEM 模 块 中 只 有 一 个 组 合 逻 辑 电路 ， 将 输入 的 执行 阶段 的 结果 直 
接 作为 输出 ， 参 考 图 4-5 可 知 ，MEM 模 块 的 输出 连接 到 MEM/WB 模 块 。 


2. MEM/WB 模 块 


MEM/WB 模 块 的 作用 是 将 访 存 阶段 的 运算 结果 ， 在 下 一 个 时 钟 传 
弟 到 回 写 阶 段 ， 其 接口 描述 如 表 4-10 所 示 。 


表 4-10 ”MEM/WB 模 块 的 接口 描述 


nn e 


a | 1 

2 1 时 钟 信号 
AS An 入 的 目的 寄存 器 地 址 

全 一 

fs | 








| mem wreg | 访 存 阶段 的 指令 最 nn 
输入 访 存 阶段 的 指令 最 ETT 
eo ee o o o 








dm [s [int menean ae | 


MEM/WB 模 块 的 代码 位 于 mem_wb.v 文 件 ， 其 主要 内 容 如 下 ， 可 以 
在 本 书 附带 光盘 的 CodeA\Chapter4\ 目 录 下 找到 源 文 件 。 











always @ (posedge clk) begin 

if(rst == "RstEnable) begin 
wb_wd <= "NOPRegAddr; 
wb_wreg <= "WriteDisable; 
wb_wdata <= "ZeroWord; 

end else begin 
wb_wd <= mem_wd; 
wb_wreg <= mem_wreg; 
wb_wdata <= mem_wdata; 

end 


end 


endmodule 


MEM/WB 的 代码 与 MEM 模 块 的 代码 十 分 相似 ， Aten Meo Fe 
递 到 对 应 的 输出 端口 ， 但 是 MEM/WB 模 块 中 的 是 时 序 罗 辑 电 路 ， 即 在 
时 钟 上 升 沿 才 发 生 信号 传递 ， 而 MEM 模 块 中 的 是 组 合 逻 辑 电 路 。 
MEM/WB 模 块 将 访 存 阶段 指令 是 否 要 写 目 的 寄存 器 mem_wreg、 要 写 的 
目的 寄存 器 地 址 mem_wd、 要 写 入 的 数据 mem_wdata 等 信息 传递 到 回 写 
阶段 对 应 的 接口 wb_wreg、wb_wd、wb_wdata。 


4.2.8” 回 写 阶段 的 实现 


经 过 上 面 的 传递 ，ori 指 令 的 运算 结果 已 经 进入 回 写 阶段 了 ， 这 个 阶 
段 实 际 上 是 在 Regfile 模 块 中 实现 的 ， 从 图 4-5 可 知 ，MEM/WB 模 块 的 输 














出 wb_wreg、wb_wd、wb_wdata 连 接 到 Regfile 模 块 ， 分 别 连接 到 写 使 能 
端口 we、 写 操作 目的 寄存 器 端口 waddr、 写 入 数据 端口 wdata， 所 以 会 将 
指令 的 运算 结果 写 入 目的 寄存 器 ， 具 体 代 码 可 以 参考 Regfile 模 块 。 











4.2.9 ”顶层 模块 OpenMIPS 的 实现 


顶层 模块 OpenMIPS 在 文件 openmips.v 中 实现 ， 主 要 内 容 就 是 对 上 面 
实现 的 流水 线 各 个 阶段 的 模块 进行 例 化 、 连 接 ， 连 接 关 系 就 如 图 4-5 所 
示 。 在 本 章 实现 的 OpenMIPS 模 块 的 接口 如 图 4-6 所 示 ， 还 是 采用 左边 是 
输入 接口 ， 右 边 是 输出 接口 的 方式 绘制 ， 便 于 理解 ， 各 接口 的 说 明 如 表 
4-11 所 示 。 可 见 与 第 3 章 的 系统 蓝图 还 有 较 大 差距 ， 很 多 接口 都 没有 ， 
在 后 续 章 节 随 着 OpenMIPS 实 现 指 令 的 增多 ， 会 逐步 完善 ， 最 终 实现 第 3 
章 的 系统 蓝图 。 


























OpenMIPS 
rst 
clk rom ce ó = 
rom_data_i rom_addr_o —— 














openmips.v 


图 4-6 0penMIPS 模 块 接 口 图 


表 4-11 OpenMIPS 模 块 的 接口 描述 


3 
1 
1 
y i 32 
addr o | 32 
| e 1 ji 





输出 输出 到 指令 存储 器 的 地 址 








代码 如 下 ， 可 以 在 本 书 附带 光盘 的 Code\Chapter 小 目录 下 找到 源 文 


Ph. 























至 此 ，ori 指 令 的 流水 线 之 旅 已 经 结束 了 ， 一 个 原始 而 简单 的 五 级 流 
水 线 结构 也 已 经 建立 了 ， 有 读者 可 能 会 怀疑 区 区 百 十 行 代码 就 实现 了 流 
水 线 ， 是 不 是 太 简单 了 ? 有 这 样 的 怀疑 是 正 第 的 ， 的 确 很 简单 ， 但 是 简 
单 并 不 代表 简陋 ， 不 代表 错误 ， 流 水 线 实际 上 并 不 是 大 家 想象 的 那么 复 
杂 ，4.3 节 ， 将 验证 本 节 实 现 的 流水 线 能 不 能 正确 工作 ， 能 不 能 正确 执 


行 ori 指 令 。 


4.3 ”验证 OpenMIPS 实 现 效 果 


4.3.1 指令 存储 器 ROM 的 实现 


本 节 将 验证 我 们 的 OpenMIPS 是 否 实现 正确 ， 包 含 : 流水 线 是 否 





确 、ori 指 令 是 否 实现 正确 。 在 验证 之 前 ， 需 要 首先 实现 指令 存储 器 
便 OpenMIPS 从 中 读 取 指令 


An 


指令 存储 器 ROM 模 块 是 只 读 的 ， ARTEN 7 所 示 ， 还 是 采用 左 





边 是 输入 接口 、 右 边 是 输出 接口 的 方式 绘制 ， 这 样 便于 理解 。 接 口 
如 表 4-12 所 示 。 
ROM 


ce inst 





addr 
inst_rom.v 
图 4-7 指令 存储 器 ROM 模 块 接口 图 


表 4-12 指令 存储 器 ROM 模 块 的 接口 描述 


SE ll | m a 
EC a 





含义 


指令 存储 器 ROM 模 块 在 文件 inst_rom.v 中 实现 ， 代 码 如 下 ， 可 以 在 


本 书 附带 光盘 的 Code\Chapter4 目 录 下 找到 源 文 件 。 


这 个 代码 很 好 理解 ， 有 以 下 几 点 说 明 。 


(1) 在 初始 化 指令 存储 器 时 ， 使 用 了 initial 过 程 语句 。initial 过 程 语 





句 只 执行 一 次 ， 通 常用 于 仿真 模块 中 对 激励 问 量 的 描述 ， 或 用 于 给 变量 
赋 初 值 ， 是 面 癌 模拟 仿真 的 过 程 语句 ， 通 常 不 能 被 综合 工具 文 持 。 所 以 
如 果 要 将 本 章 实现 的 OpenMIPS 处 理 器 使 用 综合 工具 进行 综合 ， 那 么 需 
要 修改 这 里 初始 化 指令 存储 器 的 方法 。 


(2) 在 初始 化 指令 存储 器 时 ， 使 用 了 系统 函数 $readmemh， 表 示 
从 inst_rom.data 文 件 中 读 取 数据 以 初始 化 inst_mem， 而 inst_mem 正 是 之 
前 定义 的 数组 。inst_rom.data 是 一 个 文本 文件 ， 里 面 存 储 的 是 指令 ， 其 
每 行 存 储 一 条 32 位 宽度 的 指令 〈 使 用 十 六 进 制 表 示 ) ， 系 统 函数 
$readmemh 会 将 inst_rom.data 中 的 数据 依次 填写 到 inst_mem 数 组 中 。 





(3) OpenMIPS 是 按照 字 节 寻 址 的 ， 而 此 处 定义 的 指令 存储 器 的 每 
个 地 址 是 一 个 32bit 的 字 ， 所 以 要 将 OpenMIPS 给 出 的 指令 地 址 除 以 4 再 使 
用 ， 比 如 : 要 读 取 地 址 0xC 处 的 指令 ， 那 么 实际 就 是 对 应 ROM 的 
inst_mem[3]， 如 图 4-8 所 示 。 





























OpenMIPS 给 出 
ROM 
的 指令 地 址 
0xC  —————=»>| Byte3 | Byte? | Bytel | Byte0 | inst_mem[3] 
0x8 “一 一 人 一 过 Byte3 | Byte2 | Bytel | Byte0 | inst_mem[2] 
0x4 《一 一 过 Byte3 | Byte2 | Bytel | Byte0 | inst_mem[1] 
0x0 —————=»>| Byte3 | Byte? | Bytel | Byte0 | inst mem[0] 





























图 4-8 0penM1PS 给 出 的 指令 地 址 与 ROM 中 元 素 位 置 的 关系 


除 以 4 也 就 是 将 指令 地 址 右 移 2 位 ， 所 以 在 读 取 的 时 候 给 出 的 地 址 是 
addr[InstMemNumLog2 +1:2]， 其 中 InstMemNumLog2 是 指令 存储 器 的 


实际 地 址 宽度 ， 比 如 : 如 果 inst_ mem 有 1024 个 元 素 ， 那 么 InstMemNum 
等 于 1024，InstMemNumLog2 等 于 10， 表 示 实 际 地 址 宽度 为 10。 


4.3.2 ”最 小 SOPC 的 实现 
为 了 验证 ， 需 要 建立 一 个 SOPC， 其 中 仅 OpenMIPS、 指 令 存 储 器 


ROM， 所 以 是 一 个 最 小 SOPC。OpenMIPS 从 指令 存储 器 中 读 取 指令 ， 
指令 进入 OpenMIPS 开 始 执行 。 最 小 SOPC 的 结构 如 图 4-9 所 示 。 



























OpenMIPS 
ROM 
rst . 
rom_ce_o >—— ce inst 
clk wow 
rom_data_i rom_addr_o addr 
inst_romy 












openmips.v 


图 4-9 ”最 小 SOPC 的 结构 


最 小 SOPC 对 应 的 模块 是 openmips_min_sopc， 位 于 文件 
openmips_min_sopc.v 中 ， 读 者 可 以 在 本 书 附带 光盘 的 Code\Chapter4 目 
录 下 找到 该 文件 ， 主 要 内 容 如 下 。 在 其 中 例 化 了 处 理 器 OpenMIPS、 指 
令 存 储 器 ROM， 并 将 两 者 按照 图 4-9 的 方式 进行 连接 。 


module openmips_min_sopc( 


input wire clk, 


input wire rst 





4.3.3 ”编写 测试 程序 


我 们 需要 写 一 段 测 试 程序 ， 并 将 其 存储 到 指令 存储 器 ROM， 这 样 
当 4.3.2 节 建立 的 最 小 SOPC 开 始 运行 的 时 候 ， 就 会 从 ROM 中 取出 我 们 的 





程序 ， 送 入 OpenMIPS 处 理 器 执行 。 由 于 目前 的 OpenMIPS 只 实现 了 一 条 
ori 指 令 ， 所 以 测试 程序 很 简单 ， 如 下 所 示 ， 对 应 本 书 附带 光盘 
Code\Chapter4\TestAsm 目 录 下 的 inst_rom.S 文 件 。 





ori $1,$0,0x1100 # $1 = $0 | 0x1100 = 0x1100 
Ori $2,$0, 0x0020 # $2 = $0 | 0x0020 = 0x0020 
ori $3, $0, 0xff00 # $3 = $0 | Oxff00 = Oxff00 
ori $4, $0, Oxf TTF # $4 = $0 | Oxffff = oxffff 


测试 程序 共有 4 条 指令 ， 都 是 ori 指 令 。 





第 1 条 指令 将 0x1100 进 行 零 扩 展 后 与 寄存 器 $0 进行 逻辑 “或 "运算 ， 
结果 保存 在 寄存 器 $1 中 。 





第 2 条 指令 将 0x0020 进 行 零 扩展 后 与 寄存 器 $0 进行 逻辑 “或 ”运算 ， 
结果 保存 在 寄存 器 $2 中 。 





第 3 条 指令 将 0xff00 进 行 零 扩 展 后 与 寄存 器 $0 进 行 馆 辑 * 或 "运算 ， 结 
果 保 存在 寄存 器 $3 中 。 





第 4 条 指令 将 0xffff 进 行 零 扩展 后 与 寄存 器 $0 进行 逻辑 “或 ”运算 ， 结 
果 保 存在 寄存 器 $4 中 。 


指令 的 注释 说 明了 指令 的 执行 结果 。 接 下 来 ， 按 照 正 常 的 顺序 应 该 
是 使 用 编译 器 编译 我 们 的 测试 程序 ， 但 由 于 GCC 编 译 器 的 安装 、 使 用 、 
Makefile 文 件 的 制作 等 内 容 还 需要 不 少 篇 幅 讲 解 ， 而 想必 各 位 读者 和 笔 
者 一 样 ， 和 急切 地 想 知 道 OpenMIPS 是 否 实现 正确 ， 所 以 本 节 采 用 手工 编 
译 的 方式 编译 测试 程序 ，4.4 节 将 专题 介绍 GCC 编 译 器 的 使 用 。 








手工 编译 只 须 按 照 指 令 内 容 填 充 进 如 图 4-1 所 示 的 ori 指 令 格式 中 ， 





即 可 得 到 对 应 的 二 进 制 字 ， 比 如 : 对 于 指令 ori $1,$0,0x1100， 对 应 的 二 
进 制 字 如 图 4-10 所 示 。 


31 26 25 21 20 16 15 0 





ORI 


001101 00000 00001 0001 0001 0000 0000 




















图 4-10 484 ori $1, $0, 0x1100 对 应 的 二 进 制 字 


转化 为 十 六 进 制 即 0x34011100， 其 余 3 条 指令 按照 同样 的 方式 可 以 
得 到 对 应 的 二 进 制 字 ， 按 照 $readmemh 函 数 的 要 求 ， 一 行 放 一 条 指令 ， 
得 到 测试 程序 对 应 的 isnt_rom.data 文 件 如 下 ， 可 在 本 书 附 帝 光盘 的 
Code\Chapter4\TestAsm 目 录 下 找到 同名 文件 。 





34011100 
34020020 
3403ff00 
3404f fff 


4.3.4 Æ Test Bench X f} 


本 节 将 建立 Test Bench 文 件 ， 其 中 给 出 最 小 SOPC 运 行 所 需 的 时 钟 信 
号 、 复 位 信号 。 人 代码 如 下 ， 对 应 本 书 附带 光盘 Code\Chapter4\ 目 录 下 的 
openmips_min_sopc_tb.v 文 件 。 











// 时 间 单 位 是 1ns， 精 度 是 1ps 


“timescale 1ns/1ps 


module openmips_min_sopc_tb(); 





4.3.5 “使 用 Modelsim 检 验 OpenMIPS 
实现 效果 


万 事 俱 备 ， 只 欠 东 风 了 ， 本 市 是 验证 前 的 最 后 一 步 一 一 建立 
ModelSim 工 程 ， 进 行 仿真 。 参 考 第 2 章 的 介绍 ， 新 建 一 个 ModelSim 工 
程 ， 工 程 名 可 以 为 openmips_min_sopc， 将 上 文 创建 的 OpenMIPS 所 有 源 
文件 、Test Bench 文件、 指令 存储 器 的 源 文 件 等 (也 束 是 本 书 附带 光盘 
Code\Chapter4 目 录 下 所 有 .v 文 件 ) 添加 到 工程 中 ， 然 后 编译 。 








注意 : 还 需要 将 4.3.4 节 制作 的 inst_rom.data 文 件 复制 到 ModelSim 工 
程 目录 下 。 


编译 通过 后 ， 将 workspace 切 换 到 Library 选 项 卡 ， 打 开 work 这 个 
library， 选 中 openmips_min_sopc_ 由， 用 鼠标 右键 单 击 ， 选 择 Simulate 选 
项 ， 如 图 4-11 所 示 。 





WName viType [Path 


-HEL work Library F:/Openh 
NÌ regfile Module F:/Openh 

























IN] pc_reg Module F:/Openh 
ft openmips_min_sopc_th Module F:/Open 
IM) openmips_min_sopc F:/Openh 
加 openmips slain Er F:/Openk 
fv] mem_wb simUae WIEN Tus Upumizadon F:/Opent 
[hi] mem NO: F:/Openh 
向 inst_rom Edit F:/Opent 
fv) if_id EE F:/Openh 
T id_reg Recompile F:/Openh 
Ih] id_ex ante F:/Openh 
Ih] id Update F:/Openk 
{hl ex_reg Create Wave F:/Openh 
Ih] ex_mem F:/Openh 
Ih] ex Delete F:/Openi 
A wi (unavailable) Copy wi 
SH, vital2000 mn > SMODEL_ 
| +H verilog SMODEL_ 
| +3 synopsys | Properties... SMODEL_ 
TM m: abel Dies: FRAME! 


图 4-11 选择 openmips_min_sopc_tb 作 为 仿真 对 象 


在 出 现 的 流 形 显示 界面 中 ， 添 加 要 观察 的 信号 ， 即 可 开始 仿真 。 此 
处 我 们 选择 寄存 器 $1-$4 作 为 观察 对 象 ， 如 岁 4-12 所 示 ， 通 过 观察 寄存 器 
$1-$4 的 最 终 值 ， 可 知 OpenMIPS 正 确 执行 了 测试 程序 ， 也 就 是 正确 实现 


了 ori 指 令 。 
































(2) regs[1] 就 是 $1， 最 终 值 是 0x1100 | (3) regs[2] 就 是 $2， 最 终 值 是 0x0020 
® ck sto 
» rst sto 
lx rom_ce_o Sti 








EP if inst XXX... 
1-4 reafile1/regs[1] |000... 
E$ regfile1/regs[2] |000... 
3-4 reafile1/regs[3] |000... 


® regfile1/regs[4] [0000 7 Doom _ 
CD if inst 是 取 到 的 指令 ， 从 | (4) rees[3] 就 是 53， 最 终 什 是 O00 | wen 


仿真 可 知 ， 依 次 取出 | err LE 
| 5 3 ， 最 终 值 是 Oxffff 
inst_rom.data 中 的 指令 (5) regs[4] 就 是 M4， 最 终 值 是 Oxffff | 




















图 4-12 ”从 仿真 结果 可 知 0penMIPS 正 确实 现 了 ori 指 令 


添加 更 多 要 观察 的 信 写 ， 可 以 了 解 流水 线 执行 情况 ， 如 图 4-13 所 
示 。 为 了 使 流水 线 情况 显示 得 更 加 直观 ， 此 处 以 第 一 条 指令 在 流水 线 中 
的 执行 过 程 为 例 ， 并 且 图 中 去 挥 了 其 他 指令 执行 时 引起 的 信号 变化 。 






































取 指 PEAY 执行 访 存 回 写 
» ck sto | | | | 
de rst sto 
dl; rom_ce_o Sti 
四 if_idofif_inst XXX... 
54% if_idofid_pc 000... 
€3-4 if_idofid_inst XXX... 
Als idO/wreg_o 0 
54% ido/wd_o XX 
7-4 id0/regl_o 000... 
1-4 idO/reg2_o 000... 
4% ido/alusel_o 0 1 
54 ido/aluop_o 00 00100101 
4 ex0/wreg_o 0 1 
2% ex0/wd_o XX 1 
Erf ex0/wdata_o 000... 00001100 
dx mem0/wreg_o 0 1 
€3-44 mem0/wd_o xx 1 
54% mem0/wdata_o 000... 0001100 
4% mem_wbo/wb_wreg fO 1 
Be mem_wb0/wb_wd |xx 1 
£3-4& mem_wb0/wb_wdata ]000... 0001100 
&-® regfile1/regs[1] 000... {00001100 _ 

















图 4-13 ”通过 观察 第 一 条 指令 的 执行 过 程 ， 判 断 0penMIPS 五 级 流水 线 是 否 正确 实现 


(1) 在 复位 结束 后 的 第 一 个 时 钟 周期 上 升 沿 ，rom_ce_o 变 为 
ChipEnable， 表 示 指 令 存 储 器 使 能 ， 开 始 取 指 ， 进 入 取 指 阶段 ， 从 指令 
存储 器 中 取出 第 一 条 指令 0x34011100， 赋 给 IF/ID 模 块 的 输入 端口 
if inst。 下 一 个 时 钟 周期 ， 第 一 条 指令 进入 译 码 阶段 。 


(2) 观察 译 码 阶段 


。 此 时 译 码 阶段 的 指令 id_inst 正 是 第 一 条 指令 0x34011100。 
。 指令 地 址 id_pc 是 0x00000000。 





。 在 ID 模块 对 指令 进行 译 码 ， 得 到 指令 运算 类 型 alusel _o 是 
3'b001， 查 询 defines.h 文 件 中 的 宏 定义 可 知 ， 对 应 宏 
EXE_RES_LOGIC， 表 示 是 逻辑 运算 。 

得 到 运算 子 类 型 aluop_o 是 8b00100101， 查 询 defines.h 文 件 中 的 
宏 定义 可 知 ， 对 应 宏 EXE_OR_OP， 表 示 逻 辑 “ 或 ”运算 。 

译 码 得 到 参与 运算 的 源 操作 数 1 是 0x00000000， 正 是 $0 寄存 器 
的 值 。 

译 码 得 到 参与 运算 的 源 操作 数 2 是 0x00001100， 正 是 指令 中 立 
即 数 零 扩 展 后 的 值 。 

译 码 得 到 wreg_o 的 值 为 1， 表 示 要 写 目 的 寄存 器 。 

译 码 得 到 要 写 入 的 目的 寄存 器 wd_o 是 5b00001， 正 是 $1 寄 存 
ae 











(3) 观察 执行 阶段 





。 进行 指定 的 运算 ， 得 到 wdata_o 为 0x00001100， 就 是 要 写 到 有 目 
的 寄存 器 的 数据 。 

。 传递 译 码 阶 段 wreg_o 的 值 ， 为 1， 表 示 要 写 目 的 寄存 器 。 

。 传递 译 码 阶 段 wd_o 的 值 ， 为 5b00001， 表 示 要 写 入 的 目的 寄存 
器 是 $1 寄 存 器 。 





(4) 观察 访 存 阶段 





e 传递 执行 阶段 wdata_o 的 值 ， 为 0x00001100， 表 示 要 写 到 目的 
寄存 器 的 数据 。 

。 传递 执行 阶段 wreg_o 的 值 ， 为 1， 表 示 要 写 目 的 寄存 器 。 

。 传递 执行 阶段 wd_o 的 值 ， 为 5b00001， 表 示 要 写 入 的 目的 寄存 
器 是 $1 寄 存 器 。 





(5) 观察 回 写 阶段 





得 到 访 存 阶段 wdata_o 的 值 ， 为 0x00001100， 表 示 要 写 到 目的 
寄存 器 的 数据 。 

得 到 访 存 阶段 wreg_o 的 值 ， 为 1， 表 示 要 写 目 的 寄存 器 。 

得 到 访 存 阶段 wd_o 的 值 ， 为 5b00001， 表 示 要 写 入 的 目的 寄存 
器 是 $1 寄 存 器 。 








在 回 写 阶段 的 最 后 ， 将 按照 要 求 写 目 的 寄存 器 $1， 使 得 $1 的 值 为 
0x00001100。 通 过 上 面 的 观察 ， 可 知 原始 的 OpenMIPS 五 级 流水 线 实 现 
正确 。 接 下 来 ， 我 们 就 可 以 以 此 为 基础 ， 不 断 充 实 ， 添 加 实现 更 多 的 
MIPS 指 令 ， 不 过 ， 在 此 之 前 ， 我 们 要 先 学 习 使 用 GNU 工 具 链 ， 本 节 的 
例子 只 有 4 条 指令 ， 可 以 手工 编译 ， 以 后 会 过 到 比较 复杂 ， 拥 有 较 多 指 
令 的 程序 ， 届 时 ， 手 工 编译 束 显 得 效率 低下 了 ， 所 以 要 使 用 GNU 工 具 
链 。 











4.4 MIPS 编 译 环 境 的 建立 


OpenMIPS 处 理 器 在 设计 的 时 候 束 计划 与 MIPS32 指 令 集 架构 兼容 ， 
所 以 可 以 使 用 MIPS32 架 构 下 已 有 的 GNU 开 发 工具 链 。 本 节 将 说 明 如 何 
安装 使 用 GNU 开 友 工 具 链 以 及 如 何 制 作 Makefile 文 件 ， 从 而 以 更 加 方 
便 、 快 捷 、 上 自动 的 方式 对 测试 程序 进行 编译 ， 并 得 到 指令 存储 器 ROM 
的 初始 化 文件 inst_rom.data。 





441 VisualBox 的 安装 与 设置 


GNU 工 具 链 要 安装 在 Linux 环 境 下 ， 大 多 数 读者 使 用 的 可 能 都 是 
Windows 平 台 ， 可 以 首先 安装 Linux 虚 拟 机 ， 再 在 Linux 虚 拟 机 中 安 闭 
GNU 工 具 链 。 笔 者 推荐 使 用 OpenCores 站 点 上 提供 的 一 个 Linux 虚 拟 机 镜 
像 ， 访 虚拟 机 预 装 的 是 Ubuntu 系统 。 


在 浏览 器 中 输入 地 址 : ftp:/openrisc.opencores.org/virtualbox- 
image/，FTP 的 用 户 名 和 密码 都 是 openrisc， 登 录 后 会 出 现 如 图 4-14 所 示 
界面 。 


e 


? 收藏 夹  Erir BR /virtualbox-image/ 位 于 openrisc 





FTP 目录 /virtualbox-image/ 位 于 openrisc. opencores. org 

BEE Windows 资源 管理 器 中 查看 此 FTP 站 点 ， 请 单 击 “页 面 ”， 然 后 单 击 “ 在 Windows 资源 管理 器 中 打开 FIP”. 
转 到 高 层 目录 

11/18/2011 12:00E4F 1,079,277, 665 OpenRISC_ Ubuntu, 

11/28/2011 12:00E4F 1,079, 338, 129 OpenRISC_Ubuntu_20 


12/15/2011 12:00E4F 1, 149, 072, 789 OpenRISC_Ubuntu 
12/05/2011 12:00 EF 346, 810 orpsoc. rbf 


图 4-14 Ubuntu 虚拟 机 镜像 下 载 














下 载 最 新 的 那个 文件 束 可 以 了 ， 笔 者 使 用 的 是 2011-12-15 版 。 下 载 
完成 后 解压 该 文件 ， 大 约 4GB 左 右 。 此 时 还 需要 下 载 VisualBox 才 可 以 打 
开 该 文件 。VisualBox 是 一 球 开 源 的 虚拟 机 软件 ， 本 书 使 用 的 是 4.1.22 
版 。 下 载 完成 后 安装 VisualBox， 安 装 完 成 后 打开 VisualBox， 界 面 如 图 
4-15 所 示 。 

Earache VE VirtualBox GHEE 
HEWN WEG) Bye) we ¡Do ae 


RAHA! 
SEELEN, 现在 是 空 的 ,因为 你 还 没有 新 建 任何 虚拟 电 
Ri. X = 


要 新 建 一 个 虚拟 电脑 ， 请 按 位 于 窗口 顶部 工具 栏 上 的 新 07V N 
| 建 eH. > 


ox. org 查看 最 新 信息 和 新 闻 . 
a 


ge 

你 可 以 按 ?1 BABS. 或 访问 4 

www. virtualb Y 
+ 





图 4-15 VisualBox 主 界面 


单 击 “新 建 ” 按 钮 出 现 “ 新 建 虚拟 机 ” 同 导 ， 单 击 “ 下 一 步 ” 按 钮 ， 出 现 
如 图 4-16 所 示 界 面 。 


Y 新 建 虚拟 电脑 


虚拟 电脑 名 称 和 系统 类 型 
E 


每 个 虚拟 电脑 都 要 有 一 个 唯一 的 名 称 来 标识 ， 用 来 区 分 该 虚拟 电脑 的 硬件 配置 和 
上 面 的 系统 、 软 件 和 数据 。 
名 称 (A) 


[as 





系统 类 型 (1) 
操作 系统 (8): Linux Y [97 
KAA): Ubuntu 7 


图 4-16 新 建 虚拟 机 设置 一 





此 处 操作 系统 选择 Linux， 版 本 选择 Ubuntu， 设 置 内 存 大 小 ， 单 击 
下 一 步 按 钮 ， 如 图 4-17 所 示 。 


Y FAENA 
内 存 


指定 虚拟 电脑 可 用 内 存 太 小 ， 单 位 为 : MB 。 
建议 分 配 的 内 存 太 小 是 512 MBa 
AFAR- 


3584 MB 


TE 


A417 新 建 虚拟 机 设置 二 





内 存 大 小 依据 计算 机 情况 设置 ， 笔 者 设置 的 是 512MB， 已 经 够 用 


了 ， 毕 竞 我 们 需要 编译 的 程序 都 是 十 分 简单 的 ， 单 击 下 一 步 按钮 ， 选 
择 “ 使 用 现 有 的 虚拟 硬盘 ?， 然 后 选择 解压 后 的 虚拟 机 文件 ， 如 图 4-18 所 


不 。 


Y 新 建 虚 拟 电脑 
ae BEE 


你 可 以 现在 添加 启动 盘 到 虚拟 电脑 中 。 re 或 从 列表 中 
选择 一 个 ， 也 可 以 点 文件 来 图 标 从 其 地 位 置 选择 一 


o E R ERE 


自动 磁盘 的 推荐 大 小 为 8. 00 GB. 
rapes) san 

O REUNIR C) 

© 使 用 现 有 的 虚 抽 硬盘 q 


OpenRISC_Vbuntu_2011-12-15.vdi (普通 ，40.00 GB) v 网 








A418 ”新建 虚拟 机 设置 三 





单 击 “下 一 步 ” 按 钮 ，VisualBox 会 将 用 户 刚 才 的 设置 都 列 出 来 ， 确 认 
无 误 后 ， 单 击 “ 创 建 ”" 按 钮 ， 这 样 虚拟 机 就 创建 好 了 。 启 动 虚拟 机 ， 
Ubuntu 虚拟 机 桌面 显示 如 图 4-19 所 示 。 


Get Started XL RUNTINISWLON_ [Linis Eg Se VirtualBox image 


PGA Board) ite BGA dayalgyınans De updateinfo 
Hoard Gocumentabion pul: 





图 4-19 ”Ubuntu 虚拟 机 桌面 





至 此 Linux 虚 拟 机 就 已 经 安装 好 了 ， 还 需要 多 做 一 步 工作 ， 就 是 设 
置 虚拟 机 与 Windows 宿 主机 之 间 的 共享 ， 这 样 方便 以 后 在 两 个 系统 之 间 
传递 文件 。 先 关闭 Ubuntu 虚拟 机 ， 然 后 打开 VisualBox 中 虚拟 机 的 设置 
界面 ， 选 择 “ 共 享 文件 来? 选项 ， 如 图 4-20 所 示 。 


将 OpenHIPs - 设置 


| 共享 文件 夹 
HSM ©) 


| 名称 路 径 自动 挂 载 “访问 权限 | 图 
[E a EE 


声音 

网 络 

#0 

VERS | 
共享 文件 来 


DY Y Y Y 0 0 E [E 








列 出 本 虚拟 电脑 可 访问 的 所 有 共享 交 件 来。 使 用 “net use x: \ivboxsvrishare’ 从 D03 或 
Windows PISA: share 的 共享 妇 件 来 ， 或 使 用 ‘mount -t vboxsf share 

a point Alina REA AAA Ahe FERN ap ARTO 
能 








确定 ”| [ me ]( 50 








图 4-20 虚拟 机 与 宿主 机 共享 文件 夹 设置 步骤 一 





单 击 界 面 右边 的 添加 文件 夹 按钮 ， 出 现 如 图 4-21 所 示 的 界面 。 


再 编辑 共享 文件 夫 


HES WERE: F:\VbuntuShareFolder 
HIPS: UbuntuShareFolder 


O RRA ©) 
O 自动 挂 载 W) 





图 4-21 虚拟 机 与 和 宿主 机 共享 文件 夹 设置 步骤 二 





在 其 中 选择 共享 文件 夹 的 路 径 ， 设 置 名 称 ， 参 考 图 4-21 所 示 设 置 。 
设置 完成 后 ， 可 以 局 动 虚拟 机 ， 打 开 终 端 ， 输 入 命令 : 


sudo mount -t vboxsf UbuntuShareFolder /mnt/ 


该 命令 的 作用 是 将 共享 文件 夹 挂 载 在 /mnt 目 录 下 ，sudo 表 示 以 Root 
用 户 寻 份 执行 该 命令 ， 终 端 会 提示 输入 密码 ，Ubuntu 虚 拟 机 默认 Root 用 
户 的 密码 是 openrisc。 这 样 束 实现 了 虚拟 机 与 宿主 机 的 文件 共享 ， 对 虚 
拟 机 而 言 共 享 文件 放 在 /mnt/ 路 径 下 ， 对 和 宿主 机 而 言 共 享 文件 放 在 图 4-21 
所 示 的 F 盘 UbuntuShareFolder 文 件 夹 下 。 


4.4.2 GNU 工 具 链 的 安装 





在 本 书 附 融 光盘 的 tools 目 录 下 提供 了 GNU 工 具 链 安装 文件 ， 文 件 名 
zemips-sde-elf- i686-pc-linux-gnu.tar.tar， 将 该 文件 复制 到 4.4.1 节 设置 的 
共享 文件 夹 下 ， 即 可 通过 Ubuntu 虚 拟 机 访问 该 文件 。 将 安装 文件 复制 到 
Ubuntu 的 /opt 目 录 下 ， 打 开 Ubuntu 的 终端 ， 使 用 如 下 命令 解压 缩 : 


cd /opt 


tar vfxj mips-sde-elf-i686-pc-linux-gnu.tar.tar 








然后 打开 用 户主 目录 Home 文 件 夹 ， 在 窗口 菜单 栏 中 选择 View- 
>Show Hidden Files， 以 显示 所 有 文件 ， 这 样 可 以 找到 一 个 隐藏 文 
件 .bashrc， 在 此 文件 的 最 后 加 入 PATH 的 设置 ， 如 下 。 


export PATH="$PATH:/opt/mips-4.3/bin” 


重新 启动 Ubuntu 系统 。 


重启 后 ， 打 开 终 端 ， 在 其 中 输入 mips-sde-elf-， 然 后 按 两 次 Tab 键 ， 
会 列 出 刚刚 安装 的 针对 MIPS 平 台 的 所 有 编译 工具 ， 如 图 4-22 所 示 ， 表 示 
GNU 工 具 链 安装 成 功 。 


x, openmips@openmips-VM: /opt 


openmips@openmips-VM: /opt$ mips-sde-elf- 





mips-sde-elf-addr2line mips-sde-elf-gcc mips-sde-elf-objcopy 
mips-sde-elf-ar mips-sde-elf-gcc-4.3.2 mips-sde-elf-objdump 
mips-sde-elf-as mips-sde-elf-gcov mips-sde-elf-ranlib 
mips-sde-elf-c++ mips-sde-elf-gdb mips-sde-elf-readelf 
mips-sde-elf-c++filt mips-sde-elf-gdbtui mips-sde-elf-run 
mips-sde-elf-conv mips-sde-elf-gprof mips-sde-elf-size 
mips-sde-elf-cpp mips-sde-elf-1d mips-sde-elf-sthings 
mips-sde-elf-g++ mips-sde-elf-nm mips-sde-elf-strip 


openmips@openmips-VM: /opt$ mips-sde-elf- 


图 4-22 Ubuntu 中 安装 的 编译 工具 








GNU 工 具 链 包含 很 多 工具 ， 但 我 们 使 用 得 不 多 ， 主 要 的 几 个 工具 如 
下 。 此 处 使 用 的 是 通用 名 ， 针 对 MIPS 平 台 的 工具 ， 会 在 名 称 前 增 
加 “mips-sde-elf-” 前 级 。 


e as: GNU 汇 编 嚣 ， 通 常 也 称 为 GAS (GNU Assembler)，as 对 汇 
编 源 程 序 进行 编译 产生 目标 文件 。 

e ld: GNU 链 接 器 ，as 产 生 的 目标 文件 需要 由 ld 进行 链接 、 章 定 
位 数据 产生 可 执行 文件 。 








e objcopy: 用 于 将 一 种 格式 的 目标 文件 复制 成 另外 一 种 格式 。 
e objdump: 用 于 列 出 关于 二 进 制 文件 的 各 种 信息 。 
e readelf: 类 似 于 objdump， 但 是 它 只 能 处 理 ELF 格 式 的 文件 。 


4.4.3 ”使 用 GNU 工 具 进 行 编译 





本 小 节 就 使 用 GNU 工 具 编 译 4.3 节 的 测试 程序 。 首 先 在 Ubuntu 虚拟 
机 中 新 建 一 个 文件 ， 文 件 名 为 inst_ rom.S， 内 容 如 下 。 相 比 4.3 节 的 测试 
程序 ， 多 了 三 条 编译 指导 语句 。 





.Org 0x0 // 指示 程序 从 地 址 9x0 开 始 

.global _start // 定义 一 个 全 局 符号 _start 

.Set noat // 人 允许 自由 使 用 寄存 器 $1 

_start: 

ori $1,$0,0x1100 # $1 = $0 | 0x1100 = 0x1100 
ori $2,$0,0x0020 # $2 = $0 | 0x0020 = 0x0020 
ori $3,$0,0xff00 # $3 = $0 | Oxff00 = Oxff00 
ori $4,$0,0xffff H $4 = $0 | Oxffff = Oxffff 


对 “set noat” 做 进一步 说 明 ， 这 是 一 个 汇编 控制 伪 操 作 。 在 第 1 章 介 
绍 MIPS32 架 构 中 的 通用 寄存 器 时 已 经 提 到 MIPS32 中 的 通用 寄存 器 都 有 
约定 名 称 ， 其 用 法 也 遵循 一 些 约定 ， 比 如 : 寄存 器 $1， 编 程 时 的 约定 名 
称 为 at， 一 般 留 给 汇编 器 使 用 ， 程 序 中 不 直接 使 用 。 如 果 直 接 使 用 ， 汇 
编 器 会 发 出 警告 ， 此 处 设置 “set noat”* 就 是 表示 可 以 自由 使 用 寄存 器 $1， 
汇编 器 不 会 发 出 警告 。 


在 Ubuntu 中 打开 终端 ， 使 用 cd 命令 将 路 径 调 整 到 上 述 inst_rom.S 所 


在 目录 ， 然 后 使 用 如 下 命令 编译 代码 。 其 中 添加 了 “-mips32” 选 项 ， 表 示 
按照 MIPS32 指 令 集 架构 进 行 编译 。 


mips-sde-elf-as -mips32 inst_rom.S -o inst_rom.o 








上 述 命令 会 得 到 目标 代码 inst_ rom.o0。 打 开 inst_rom.o 文 件 ， 可 以 发 
现 其 最 初 的 四 个 字 节 是 : 0x7F、0x45、0x4C、0x46， 这 说 明 inst_ rom.o 
是 一 个 ELF 文 件 ， 如 图 4-23 所 示 。 










4 = A 9 > m d = 
00000000h: Md 01 02 01 00 00 00 00 00 00 00 00 00 + 
G0000010h: 00 01. BD 98 00.00 00:01 08 00.00 00 00 00.00 00 4 wie e ere eas 
00000020h: 00 00 00 98 50 00 00 00 00 34 00 00 00 00 00 28; ...®....4..... f 
000000350h: 00 09 00 06 34 01 11 00 34 02 00 20 34 03 FF OO; ....4...4.. 4. . 





4-23 inst_rom. o 的 开始 部 分 


为 了 便于 读者 理解 ， 下 面 将 简单 介绍 一 下 ELF 文 件 ， 读 者 朋友 如 果 
对 这 不 感 兴趣 或 者 希望 尽快 了 解 编译 链接 过 程 的 可 以 跳 过 下 面 的 介绍 ， 
直接 阅读 4.4.4 节 。 


ELF (Executable and Linkable Format) 可 执行 链接 格式 ， 是 UNIX 
系统 实验 室 (USL) 作为 应 用 程序 二 进 制 接口 〈Application Binary 
Interface, ABD 而 开发 和 发 布 的 。ELE 目 标 文 件 有 三 种 类 型 。 


(1) 可 重 定 位 (Relocatable) 文件: 保存 着 代码 和 适当 的 数据 ， 
用 来 和 其 他 Object 文件 一 起 创建 一 个 可 执行 文件 或 共享 文件 。 





(2) 可 执行 (Executable) 文件 : 保存 着 一 个 用 来 执行 的 程序 ， 访 
文件 指出 了 如 何 来 创建 程序 进程 映 象 。 


(3) 共有 至 目标 文件 ， 包含 了 在 两 种 使 用 环境 中 链接 的 代码 和 数 
据 。 首 先 链接 器 (ld) 可 以 将 它 和 其 余 可 重 定位 文件 和 共 至 目标 文件 一 


起 处 理 ， 生 成 另外 一 个 目标 文件 〈 比 如 : 编译 器 和 链接 器 把 *.o 和 *.so 一 

起 装配 成 一 个 *.exe 文 件 ) 。 其 次 ， 动 态 链 接 器 (Dynamic Linker) 可 将 

它 与 某 个 可 执行 文件 以 及 其 他 共享 目标 文件 组 合 在 一 起 创建 进程 映像 
(比如; 动态 加 载 器 把 *.exe 程 序 和 *.so 加 载 进 内 存 执行 )。 





无 论 何 种 类 型 的 ELF 文 件 ， 其 结构 都 是 相同 的 。ELF 文 件 由 四 部 分 
组 成 : ELF header、Program header table、Sections、Section header 
table。 其 最 开始 的 部 分 就 是 ELF header， 定 义 如 下 : 


#define EI_NIDENT 16 


typedef struct{ 


unsigned char e_ident[EI_NIDENT]; // 占 用 16 个 字 节 
Elf32_Half e_type; //E1Lf32_Half 表 示 是 2 个 
Elf32_Half e_machine; 

E1f32_word e_version; //Elf32_Word 表 示 是 4 人 1 
ELf32_Addr e_entry; //E1f32_addr 13544 
Elf32_off e_phoff; /VELf32_0ff 也 表示 4 个 : 
EJf32_0f e_shoff; 

Elf32_Word e_flags; 

Elf32_Half e_ehsize; 

Elf32_Half e_phentsize; 

Elf32_Half e_phnum; 

Elf32_Half e_shentsize; 

Elf32_Half e_shnum; 

Elf32_Half e_shstrndx; 


}Elf32_Ehdr; 








开始 四 个 字 节 是 固定 不 变 的 : 0x7F， 紧 接着 是 ELF 三 个 字符 的 


ASCII 码 ， 这 四 个 字 节 表明 这 个 文件 是 一 个 ELF 文 件 。 此 人 处 以 inst_rom.o 
为 例 ， 介 绍 e_ident 字 段 后 面 字 节 的 含义 ， 参 考 图 4-23。 














e_type 是 01， 表 示 是 可 重 定位 文件 。 

e_machine 表 示 运 行 该 程序 需要 的 体系 结构 ， 此 处 为 0x08， 表 
示 MIPS R3000. 

e_Version 表 示 文 件 版 本 ， 此 处 是 1。 

e_entry 表 示 程 序 的 入 口 地 址 ， 此 处 是 0x0。 

e_phoff 是 Program header table 在 文件 中 的 偏 移 量 〈 以 字 节 计 
数 ) ， 此 处 是 0x0。 

e_shoff 是 Section header table 在 文件 中 的 偏 移 量 〈 以 字 节 计 
数 ) ， 此 处 为 0x98。 

e_flags 为 保存 着 相关 文件 的 特定 处 理 器 信息 ， 此 处 为 
0x50000000， 表 示 MIPS32。 

e_ehsize 表 示 ELF header 的 大 小 ， 此 处 为 0x34。 
e_phentsize 表 示 Program header ”table 中 每 一 个 条 目 (一 个 
Program header) 的 大 小 ， 此 处 为 0x0。 

e_phnum 表 示 Program header table 中 有 多 少 个 条 目 ， 此 处 为 0。 
e_shensize 表 示 Section header table 中 每 一 个 条 目 〈 一 个 Section 
header) 的 大 小 ， 此 处 为 0x28。 

e_shnum 表 示 Section header table 中 有 多 少 个 条 有 目 ， 此 处 为 
0x09. 

e_shstrndx TA TRAER RA FT KBR], HEAR A 
0x06. 


























上 述 解 释 可 以 了 解 到 这 个 文件 是 一 个 可 重 定 位 CRelocatable ) 


文件 ， 不 是 可 执行 文件 ， 同 时 了 解 到 该 文件 包含 的 Program header 


table, Section header table 信 息 。 对 inst_rom.o 而 言 ， 没 有 Program header 


table。 按 照 给 出 的 偏 移 信息 ， 我 们 可 以 得 到 Section header table 表 的 位 
置 ， 通 过 Section header table 得 到 每 个 Section 的 位 置 。 


当然 ， 按 照 ELF header 的 内 容 以 及 Section header table， 我 们 可 以 按 
图 过 双 地 分 析 所 有 Section， 但 是 这 样 做 效率 太 低 ， 借 助 于 GNU 工 具 链 中 
的 mips-sde-elf-readelf， 我 们 可 以 直接 得 到 Section 人 信息， 如 图 4-24 所 示 。 


Imips-sde-elf-readelf -S inst_rom.o 
There are 9 section headers, starting at offset 0x98: 


` 
Section Headers: 
[Nr] Name Type Addr off Size ES Flg Lk Inf Al 
[ 9] NULL 00000000 000000 000000 00 0 9 0 
[ 1] «text PROGBITS 00000000 000034 000010 00 AX © © 4 
[ 2] .data PROGBITS 00000000 000044 000000 00 WA © o 1 
[ 3] .bss NOBITS 00000000 000044 000000 00 WA 9 o 1 
[ 4] .reginfo MIPS_REGINFO 00000000 000044 000018 18 9 o 4 
[ 5] .pdr PROGBITS 00000000 00005c 000000 00 9 O 4 
[ 6] .shstrtab STRTAB 00000000 00005c 00003a 00 9 o 1 
[ 7] .symtab SYMTAB 00000000 000200 000070 10 8 6 4 
[ 8] .strtab STRTAB 00000000 000270 000008 00 9 o 1 
Key to Flags: 
W (write), A (alloc), X (execute), M (merge), S (strings) 
I (info), L (link order), G (group), x (unknown) 
O (extra OS processing required) o (OS specific), p (processor specific) 


图 4-24 利用 工具 mips-sde-elf-readelf 可 以 得 到 所 有 的 Section 信 息 


注意 添加 “-S” 选 项 。 这 里 列 出 了 9 个 Section 的 信息 ， 注 意 其 中 
的 和 .text” 这 个 Section， 它 的 起 始 地 址 是 0x34， 长 度 是 0x10， 我 们 列 出 这 
个 Section 的 内 容 如 图 4-25 所 示 。 


00000030h: 00 09 00 06 gE 所 下 是 EP 
00000040h: guy OO 00 DO 1E 00 00 00 00 00 00 00 00 


图 4-25 Section . text 的 内 容 


参考 4.3.3 节 可 知 ， 这 0x10 个 字 节 正 是 测试 程序 中 的 4 条 指令 对 应 的 
二 进 制 数 字 。 


4.4.4 使 用 GNU 工 具 进 行 链 接 





通过 编译 得 到 了 一 个 可 重 定位 ELF 文 件 ， 但 这 个 文件 还 不 能 执行 ， 
需要 通过 链接 转化 为 可 执行 文件 ， 然 后 才能 执行 。 使 用 链接 工具 mips- 
sde-elf-ld 完 成 这 项 工作 ， 在 mips-sde-elf-ld 的 参数 中 需要 声明 一 个 链接 描 
述 脚本 ， 链 接 描述 脚本 描述 了 输入 文件 的 各 个 Section 如 何 映 射 到 输出 文 
件 的 各 个 Section 中 ， 并 控制 输出 文件 中 Section 和 符号 的 内 存 布 局 。 可 以 
通过 新 建 一 个 Document 作 为 链接 描述 脚本 ， 文 件 名 为 ram.l1d， 内 容 如 
Be 





.bss : 


£ 
*(.bss) 
} > ram 


ENTRY (_start) 


其 中 定义 了 一 个 存储 块 一 一 ram， 其 起 始 地 址 是 0x0， 长 度 是 
0x1000， 然 后 指示 链接 器 输出 文件 包含 三 个 Section， 分 别 
是 .text、.data、.bss， 其 中 .text 从 ram 的 起 始 地 址 开始 存放 ， 后 面 跟 
着 .data、.bss， 并 且 输 入 文件 的 Section .text 存 放 在 输出 文件 的 .text 中 ， 输 
入 文件 的 Section .data 存 放 在 输出 文件 的 .data 中 ， 输 入 文件 的 Section .bss 
存放 在 输出 文件 的 .bss 中 。 最 后 的 Entry 指 定 程 序 的 入 口 地 址 ， 也 束 是 第 
一 条 执行 的 指令 地 址 是 _start 符 号 的 值 ， 从 汇编 代码 中 可 知 _start 符 号 就 
是 0x0。 现 在 就 可 以 使 用 链接 器 了 ， 在 Ubuntu 虚拟 机 的 终端 中 输入 如 下 


AA 
iTS 











mips-sde-elf-1d -T ram.ld inst_rom.o -o inst_rom.om 


得 到 链接 后 的 文件 inst_rom.om， 这 也 是 一 个 ELF 格 式 的 文件 ， 其 
ELF header 如 图 4-26 所 示 。 


00000000h: BEE 01 02 01 00 00 00 00 00 00 00 00 00 ; 

BODOOG10h: 00 02 00 08 00 00 00 01 00:00 00 00 00 00 00-34 f se 4 
00000020h: 00 01 00 54 50 00 00 00 00 34 00 20 00 01 00 28 ; ...TP....4. +... f 
00000030h: DO 06 00 03 00 00 00 01 00 01 00 00 00 00 00 OD 2 oo, 





图 4-26 inst_rom. om 的 ELF header 


上 一 小 节 是 手工 分 析 inst_rom.o 的 ELF header， 主 要 是 为 了 帮助 读者 





理解 ， 其 实 可 以 直接 使 用 工具 分 析 ELF 
将 自动 分 析 inst_rom.om 的 ELF header。 


mips-sde-elf-readelf -h inst_rom.om 


其 中 加 上 参数 “-h” 表 示 只 读 取 ELF 


header， 在 终端 中 输入 如 下 命令 


header， 得 到 结果 如 图 4-27 所 


mips-sde-elf-readelf -h inst_rom.om 
ELF Header: 


Magic: 7f 45 4c 46 01 02 01 00 0 
Class: 

Data: 

Version: 

OS/ABI: 

ABI Version: 

Type: 

Machine: 

Version: 

Entry point address: 

Start of program headers: 

Start of section headers: 

Flags: 

Size of this header: 

Size of program headers: 

Number of program headers: 

Size of section headers: 

Number of section headers: 

Section header string table index: 


0 00 00 00 00 00 00 00 
ELF32 

2's complement, big endian 
1 (current) 

UNIX - System V 

0 

EXEC (Executable file) 
MIPS R3000 

0x1 

0x0 

52 (bytes into file) 
65620 (bytes into file) 
0x50000000, mips32 

52 (bytes) 

32 (bytes) 

1 

40 (bytes) 

6 


3 


图 4-27 inst_rom. om 的 ELF header 信 息 


从 图 4-27 中 可 知 inst_rom.om 是 一 个 可 执行 文件 。 读 者 朋友 也 许 已 经 
注意 到 了 ，inst_rom.om 比 inst_rom.0 多 了 Program header， 而 这 在 


inst_rom.0 里 面 是 没有 的 ， 与 Section he 
使 用 一 个 结构 体 描 述 ， 如 下 。 


typedef struct{ 
Elf32_Word p_type; 


ader—#f, Program header 也 可 以 


Elf32_Off p_offset; 


Elf32_Addr p_vaddr; 


Elf32_Addr p_paddr; 
Elf32_Word p_filez; 
Elf32_Word p_memsz; 
Elf32_Word p_flags; 
Elf32_Word p_align; 


}Elf32_Phdr; 


我 们 还 是 使 用 工具 mips-sde-elf-readelf 从 inst_rom.om 中 分 析出 一 个 
Program header， 然 后 结合 这 个 Program ” ”header 解释 上 面 各 个 各 项 的 含 
义 。 使 用 如 下 命令 得 到 Program header 的 信息 。 


mips-sde-elf-readelf -1 inst_rom.om 





其 中 加 上 “-1 参 数 ， 表 示 列 出 Program header 的 信息 ， 显 示 如 图 4-28 
所 示 。 


mips-sde-elf-readelf -L inst_rom.om 

ELf file type is EXEC (Executable file) 

Entry point 0x0 

There are 1 program headers, starting at offset 52 
Program Headers: 


Type Offset VirtAddr PhysAddr FileSiz MemSiz Flg Align 
LOAD 0x010000 0x00000000 0x00000000 0x00010 0x00010 R E 0x10000 


图 4-28 Program header (3.8: 


借助 上 图 介绍 Program header 各 个 字段 的 含义 : 





。p_type 为 LOAD， 表 示 可 加 载 。 

e p_offset 表 示 上 段 的 第 一 个 字 节 在 文件 inst_rom.om 中 的 偏 移 ， 此 
处 为 0x10000。 

。p_vaddr 表 示 段 的 第 一 个 字 节 在 内 存 中 地 址 ， 此 处 为 0。 





。p_paddr 为 0， 在 物理 地 址 定位 有 关联 的 系统 中 ， 该 成 员 是 为 该 
段 的 物理 地 址 而 保留 的 。 

。p_filez 表 示 段 在 文件 中 的 长 度 ， 此 处 为 0x10。 

。P_memsz 表 示 段 在 内 存 中 的 长 度 ， 此 处 为 0x10。 

p_flags 为 RE， 表 示 可 读 、 可 执行 。 

e p_align 为 0x10000， 根 据 此 项 确定 段 在 文件 以 及 内 存 中 如 何 对 
齐 。 


该 Program header 表示 将 inst_rom.om 文 件 中 从 偏 移 0x10000 开 始 的 
0x10 个 字 节 放置 在 内 存 的 0x0 处 ， 打 开 inst_rom.om 可 以 发 现 从 偏 移 
0x10000 开 始 的 0x10 个 字 节 的 内 容 与 inst_rom.o 中 Section .text 的 内 容 一 
样 ， 所 以 当 这 个 Program Section 加 载 入 内 存 后 ， 会 使 得 内 存 从 地 址 0x0 开 
始 的 0x10 个 字 节 存放 的 就 是 测试 程序 的 4 条 指令 。 





分 析 到 这 里 ， 读 者 是 不 是 对 编译 、 链 接 过 程 有 了 比 之 前 更 深 的 了 
解 ? 其 实 这 些 背景 知识 与 OpenMIPS 处 理 器 关系 不 大 ， 但 是 知道 这 些 有 
助 于 理解 编译 链接 的 过 程 。 总 结 一 下 ， 编 译 链接 的 过 程 很 简单 ， 只 需要 
两 步 ， 如 下 。 


编译 : mips-sde-elf-as -mips32 inst_rom.S -o inst_rom.o 


链接 : mips-sde-elf-1d -T ram.ld inst_rom.o -o inst_rom.om 


4.4.5 ”得 到 ROM 初 始 化 文件 


4.4.4 节 得 到 的 inst_rom.om 是 一 个 ELE 格 式 的 可 执行 文件 ， 与 我 们 希 
望 的 指令 存储 器 ROM 初 始 化 文件 inst_rom.data 的 格式 有 很 大 区 别 ， 需 要 
进行 格式 转化 。 在 GNU 工 具 链 中 提供 了 另 一 个 工具 mips-sde-elf- 


objcopy， 用 于 将 一 种 格式 的 目标 文件 转化 成 男 外 一 种 格式 。 在 这 里 ， 
可 以 使 用 mips-sde-elf-objcopy 得 到 inst_rom.om 的 二 进 制 (Binary) JE 
式 ， 使 用 方法 如 下 。 得 到 的 二 进 制 文 件 inst_rom.bin 的 内 容 如 图 4-29 所 
不 。 


mips-sde-elf-objcopy -0 binary inst_rom.om inst_rom.bin 





从 图 4-29 可 以 发 现 ，bin 文 件 的 内 容 正 是 测试 程序 中 4 条 指令 对 应 的 
二 进 制 字 ， 现 在 只 需要 编写 一 个 小 程序 将 bin 文 件 转 化 为 ModelSim 中 存 
储 器 初始 化 文件 的 格式 。 这 个 小 程序 很 简单 ， 此 处 不 再 列 出 代码 ， 在 本 
书 附带 的 光盘 中 可 以 找到 源 程序 ， 程 序 名 为 Bin2Mem.exe， 使 用 方法 如 
下 。 得 到 的 inst_rom.data 文 件 如 图 4-30 所 示 。 





./Bin2Mem.exe -f inst_rom.bin -o inst_rom.data 


00000000h: 34 01 11 00 34 02 OO 20 34 03 FF 00 34 04 FF 5 


图 4-29 inst_rom.bin 文 件 的 内 容 


1 34011100 
z 34020020 
3 S405[I[I00 
4 330 4EEEE 


图 4-30 inst_rom. data 文 件 的 内 容 





好 了 ， 现 在 回忆 一 下 从 源 代码 得 到 ModelSim 仿 真 时 可 以 使 用 的 指 
令 存 储 器 ROM 初 始 化 文件 一 共 需 要 4 步 : 编译 、 链 接 、 得 到 bin 文 件 、 格 
Teeth, MT: 





4.4.6 ”编写 Makefile 文 件 


为 了 得 到 指令 存储 器 初始 化 文件 ， 我 们 需要 输入 4 条 命令 ， 有 点 麻 
烦 ， 最 好 只 输入 一 条 命令 就 可 以 了 ， 这 需要 使 用 Makefile 文 件 。 在 汇编 
程序 inst_rom.S 所 在 目录 下 新 建 一 个 Document， 文 件 名 为 Makefile， 内 容 
Ui Es 








这 是 一 个 很 简单 的 Makefile， 借 助 于 它 介 绍 Makefile 的 组 成 。 
Makefile 的 前 半 部 分 是 一 些 变量 的 定义 ， 比 如 : 定义 CC 为 mips-sde-elf- 
as， 定 义 LD 为 mips-sde-elf-14， 其 中 引用 了 预定 义 的 变量 
CROSS_COMPILE。Makefile 的 后 半 部 分 定义 了 多 个 目标 ， 有 all、clean 
等 ， 采 用 的 语法 如 下 : 





上 述 形式 表示 的 意思 是 : (1) 要 想得到 “目标 ?， 那 么 需要 执行 “ 命 
令 ”; (D “目标 ”依赖 于 “依赖 文件 ”， 当 “依赖 文件 ”中 人 至少 一 个 文件 
比 “ 目 标 ” 文 件 新 时 ，“ 命 令 ” 才 被 执行 。 在 上 耐 Makefile 的 “命令 ”中 使 用 
了 Makefile 一 些 预 定义 的 变量 ， 含 义 如 下 : 





$< 表示 第 一 个 依赖 文件 的 名 称 
$@ 表示 目标 的 完整 名 称 


所 以 上 述 Makefile 可 以 解读 如 下 : 





(1) 用户 输入 make all， 要 求 得 到 目标 all， 目 标 al 的 依赖 文件 是 


inst_rom.data， 要 先 得 到 inst_rom.data。 
(2) 要 得 到 inst_rom.data， 需 要 依赖 文件 inst_rom.bin。 
(3) 要 得 到 inst_rom.bin， 需 要 依赖 文件 inst_rom.om。 


(4) 要 得 到 inst_rom.om， 需 要 依赖 文件 $(OBJECTS)， 其 中 
OBJECTS 是 预定 义 变量 ， 其 值 为 inst_rom.0， 所 以 此 处 就 是 需要 依赖 文 


件 inst_rom.o。 





(5) 要 得 到 inst_rom.o0， 需 要 依赖 文件 inst_rom.S， 访 文件 已 经 提 
供 ， 满 足 依 赖 条 件 ， 所 以 会 执行 命令 $(CC) -mips $< -o $@， 实 际 就 是 
如 下 命令 ， 执 行 后 得 到 inst_rom.o。 


mips-sde-elf-as -mips inst_rom.S -o inst_rom.o 


(6) 得 到 inst_rom.o 后 ， 满 足 了 目标 inst_rom.om 的 依赖 条 件 ， 所 以 
可 以 进一步 得 到 inst_rom.om， 通 过 执行 命令 $CLD) -T ram.ld 
$(OBJECTS) -o $@， 实 际 就 是 通过 如 下 命令 得 到 inst_rom.om。 





mip-sde-elf-ld -T ram.ld inst_rom.o -o inst_rom.om 


(7) 得 到 inst_ rom.om 后 ， 满 足 了 目标 inst_rom.bin 的 依赖 条 件 ， 所 
以 可 以 进一步 得 到 inst_rom.bin， 通 过 执行 命令 $(OBJCOPY) -O binary $< 
$@， 实 际 就 是 通过 如 下 命令 得 到 inst_rom.bin。 








mip-sde-elf-objcopy -0 binary inst_rom.om inst_rom.bin 


(8) 得 到 inst_rom.bin 后 ， 满 足 了 目标 inst_rom.data 的 依赖 条 件 ， 所 
以 可 以 进一步 得 到 inst_rom.data， 通 过 执行 命令 ./Bin2Mem.exe -f $< -o 
$@， 实 际 就 是 通过 如 下 命令 得 人 inst_rom.data。 








./Bin2Mem.exe -f inst_rom.bin -o inst_rom.data 


(9) 得 到 inst_rom.data， 满 足 了 目标 是 的 依赖 条 件 ， 从 而 实现 目标 
all. 


有 了 Makefile 文 件 ， 我 们 在 终端 中 输入 “make al 就 可 以 完成 所 有 的 


简单 总 结 一 下 从 测试 程序 得 到 指令 存储 器 ROM 初 始 化 文件 的 步骤 
如 下 。 


e 编写 源 代 码 ， 当 然 是 汇编 代码 ， 文 件 名 为 inst_rom.S。 

。 复制 本 节 编 写 的 Makefile、Bin2Mem.exe、ram.ld 到 源 代码 所 在 
目录 。 

e 打开 终端 ， 路 径 调 整 到 源 代 码 所 在 目录 ， 输 入 “make all”. 


经 过 上 述 步 又 ， 即 可 得 到 能 够 在 ModelSim 仿 真 中 使 用 的 指令 存储 
右 ROM 人 初始化 文件 inst_rom.data。 





最 后 ， 我 们 可 以 增加 一 步 ， 使 用 工具 mips-sde-elf-objdump 对 
inst_rom.om 进 行 反 汇编 ， 从 而 得 到 指令 与 其 二 进 制 字 的 对 应 。 如 下 。 


mips-sde-elf-objdump -D inst_rom.om > inst_rom.asm 


得 到 inst_rom.asm 文 件 ， 使 用 记事 本 打开 该 文件 ， 内 容 如 图 4-31 所 
No Haie a ， 其 对 应 的 就 是 测试 程序 的 4 
条 指令 。 每 一 行 分 为 三 列 : 左边 一 列 是 指令 地 址 ， 中 间 一 列 是 指令 对 应 
的 二 进 制 字 ， nn Po ER: 这 里 的 指令 进行 了 变化 ， 虽 然 测 
试 程序 都 是 ori 指 令 ， 但 是 这 里 都 改 成 li 指令，1i 是 汇编 指令 ，ori 是 机 器 
指令 ， 两 者 是 相等 的 。 





li rt, immediate => ori rt,$0, immediate 
inst rom.om: file format elf32-tradbiqmips 


Disassembly DE section texts 


ooo00000 <_Start>: 
O: 34011100 li at,Ox1100 
4: 34020020 li v0,0x20 


8: 93205 600 Li wi oxtroo 
Ce coe eronope UL ce 
Disassembly of section .reginfo: 





00000000 < ram end-0x10>: 
O: 0000001e Oxie 


00000010 < ram end>: 


图 4-31 inst_rom. asm 文 件 的 内 容 


另外 ， 此 处 的 寄存 器 没有 使 用 $1、$2、$3、$4 这 种 方式 ， 而 是 使 用 
了 约定 命名 。MIPS32 中 通用 寄存 器 的 约定 命名 可 以 参考 第 1 章 的 表 1-1。 


有 了 inst_rom.asm 文 件 ， 在 进行 仿真 波形 分 析 的 时 候 ， 有 助 于 将 仿真 波 
形 中 的 32bit 二 进 制 指令 字 与 汇编 程序 中 的 指令 对 应 ， 便 于 分 析 。 





可 以 修改 Makefile 文 件 ， 使 得 在 编译 得 到 inst_rom.data 的 同时 得 到 反 
汇编 文件 inst_rom.asm， 有 具体 修改 方法 不 再 详 述 ， 读 者 可 以 参考 本 书 附 
CR HY Code\Chapter4\TestAsm H >& F PJMakefile X4. 


45 第 一 条 指令 实现 小 结 





本 章 是 很 重要 的 一 草 ， 而 且 内 容 相对 比较 杂 ， 在 此 做 一 小 结 ， 主 要 
做 了 四 项 工作 。 


(1) 本 章 通 过 实现 指令 ori， 搭 建 了 一 个 原始 的 五 级 流水 线 结构 ， 
这 也 是 OpenMIPS 的 核心 ， 当 然 ， 目 前 OpenMIPS 还 只 能 执行 ori 指 令 ， 后 
续 会 逐步 丰富 。 


(2) 实现 了 一 个 用 于 测试 的 最 小 SOPC， 仅 仅 包括 处 理 露 
OpenMIPS、 指 令 存储 器 ROM， 并 编写 了 Test Bench 测 试 文件 。 


(3) 在 ModelSim 中 通过 仿真 验证 了 ori 指 令 实现 的 正确 性 ， 也 验证 
了 OpenMIPS 五 级 流水 线 实现 的 正确 性 。 


(4) 详细 介绍 了 从 汇编 代码 编写 的 测试 程序 得 到 仿真 中 使 用 的 指 
令 存储 器 初始 化 文件 的 过 程 ， 同 时 ， 利 用 Makefile 简 化 了 这 个 过 程 。 


Fa PE, BURTFSEHT 
的 实现 


第 4 章 建 立 了 原始 的 OpenMIPS 五 级 流水 线 结构 ， 但 是 只 实现 了 一 条 
ori 指 令 ， 从 本 章 开 始 ， 将 逐步 完善 。 本 章 首 先 讨论 了 流水 线 数据 相关 问 
题 ， 然 后 修改 OpenMIPS 以 解决 该 问题 ， 并 在 5.3 节 验证 了 解决 效果 。 接 
着 对 逻辑 、 移 位 操作 与 空 指令 的 指令 格式 、 用 法 、 作 用 进行 了 一 一 说 
明 ， 在 5.5 节 通过 扩展 OpenMIPS 实 现 了 这 些 指 令 ， 最 后 编写 测试 程序 ， 
对 实现 效果 进行 了 检验 。 

















5.1 流水 线 数据 相关 问题 


我 们 在 第 4 章 实 现 的 五 级 流水 线 结构 很 简单 ， 如 果 按 照 " 简 单 即 
x” (Simple is Beautiful) 的 标准 ， 那 么 我 们 的 流水 线 是 美的 ， 但 是 不 完 
美 ， 因 为 现实 往往 是 复杂 的 ， 一 个 简单 的 流水 线 是 解决 不 了 如 此 多 现实 
问题 的 ， 本 市 探讨 的 数据 相关 问题 就 是 其 中 一 个 问题 。 在 我 们 实现 逻 
辑 、 移 位 操作 等 其 他 指令 之 前 ， 必 须 先 讨论 这 个 问题 ， 因 为 这 个 问题 已 
经 影响 测试 程序 的 编写 了 。 








流水 线 中 经 第 有 一 些 被 称 为 “相关 ”的 情况 发 生 ， 它 使 得 指令 序列 中 
下 一 条 指令 无 法 按照 设计 的 时 钟 周 期 执行 ， 这些“ 相关 ”会 降低 流水 线 的 
性 能 。 流 水 线 中 的 相关 分 为 以 下 三 种 类 型 。 








(1) 结构 相关 : 指 的 是 在 指令 执行 的 过 程 中 ， 由 于 人 硬件 资源 满足 
不 了 指令 执行 的 要 求 ， 发 生硬 件 资源 冲突 而 产生 的 相关 。 比 如 : 指令 和 
数据 都 共 孚 一 个 存储 器 ， 在 茶 个 时 钟 周期 ， 流 水 线 既 要 完成 东 条 指令 对 
存储 需 中 数据 的 访问 操作 ， 又 要 完成 后 续 的 取 指 令 操作 ， 这 样 吏 会 发 生 
TERV AR, TRE o 


(2) 数据 相关 : 指 的 是 在 流水 线 中 执行 的 几 条 指令 中 ， 一 条 指令 
依赖 于 前 面 指令 的 执行 结 

(3) 控制 相关 : 指 的 是 流水 线 中 的 分 文 指令 或 者 其 他 需要 改写 PC 
的 指令 造成 的 相关 。 





结构 相关 、 控 制 相 关 将 在 后 续 指 令 分 析 中 讨论 ， 本 节 重 点 讨论 数据 
相关 的 问题 。 流 水 线 数据 相关 又 分 为 三 种 情况 : RAW、WAR、 


WAW. 





e RAW， 即 Read After Write， 假 设 指 令 j 是 在 指令 j 后 面 执行 的 指 
令 ，RAW 表 示 指 令 ji 将 数据 写 入 寄存 器 后 ， 指 令 j 才 能 从 这 个 寄 
存 器 读 取 数 据 。 如 果 指 令 j 在 指令 i 写 入 寄存 器 前 尝试 读 出 该 寄 
存 器 的 内 容 ， 将 得 到 不 正确 的 数据 。 

e WAR, EllWrite After Read， 假 设 指令 j 是 在 指令 ji 后 面 执行 的 指 
令 ，WAR 表 示 指 令 i 读 出 数据 后 ， 指 令 j 才 能 写 这 个 寄存 器 。 如 
果 指 令 j 在 指令 i 读 出 数据 前 就 写 该 寄存 器 ， 将 使 得 指令 i 读 出 的 
数据 不 正确 。 

e WAW， 即 Write After Write， 假 设 指令 是 在 指令 ji 后 面 执行 的 
指令 ，WAW 表 示 指 令 ;ji 将 数据 写 入 寄存 器 后 ， 指 令 j 才 能 将 数据 
写 入 这 个 寄存 器 。 如 果 指 令 j 在 指令 之 前 写 该 寄存 器 ， 将 使 得 
该 寄存 器 的 值 不 是 最 新 值 。 




















对 于 第 4 章 建立 的 原始 OpenMIPS 五 级 流水 线 而 言 ， 从 ori 指 令 的 实现 
过 程 可 以 知道 ， 只 有 在 流水 线 回 写 阶段 才 会 写 寄存 器 〈 实 际 上 ， 其 余 指 
令 也 是 一 样 的 ， 在 后 面 实现 其 余 指 令 时 ， 对 这 一 点 会 更 加 清楚 〉 ， 因 此 
不 存在 WAW 相 关 。 又 因为 只 能 在 流水 线 译 码 阶段 读 寄存 器 、 回 写 阶 段 
写 寄存 器 ， 不 存在 WAR 相 关 ， 所 以 OpenMIPS 的 流水 线 只 存在 RAW 相 
关 。RAW 相 关 有 三 种 情况 。 


© 相 邻 指令 间 存 在 数据 相关 
考虑 如 下 代码 。 


1 ori $1,$0,0x1100 # $1 = $0 | 0x1100 = 0x1100 
2 ori $2,$1,0x0020 # $2 = $1 | 0x0020 = 0x1120 


第 1 条 ori 指 令 将 写 寄 存 串 $1， 随 后 的 第 2 条 ori 指 令 需要 该 出 $1 的 数 
据 ， 但 是 第 1 条 ori 指 令 在 回 写 阶段 才 会 将 其 运算 结果 写 入 $1， 而 第 2 条 
ori 指 令 在 译 码 阶段 就 需要 读 取 $1 的 值 ， 此 时 第 1 条 ori 指 令 还 处 于 执行 阶 
段 ， 所 以 得 到 的 必然 不 是 第 1 条 ori 指 令 计 算得 出 的 结果 ， 按 这 个 值 运 
算 ， 必 然 会 出 错 。 如 图 5-1 所 示 ， 这 种 情况 可 以 称 为 相 邻 指令 间 存 在 数 
所 相关 ， 针 对 OpenMIPS 的 其 体 情况 ， 也 可 以 称 为 流水 线 译 码 、 执 行 阶 
段 存 在 数据 相关 。 











第 1 条 ori 指 令 将 在 回 写 阶段 最 后 
/的 时 钟 上 升 沿 把 运算 结果 写 入 $1 
/ 
+ / \ \ \ \ \ TA TE A / 
N dl / \ / \ / \ / \ / \ vi | \ / \ / \ / \ / 
/ 
1 ori $1,80,0x1100 mas x IEX DPX iE x 回 写 > 
2 ori $2,$1,0x0020 oa CE > 执行 E > 


Fi 
第 2 条 ori 指 令 将 在 译 码 阶段 取得 $1 | 
的 值 ， 此 时 得 到 的 不 是 正确 的 值 


图 5-1 相 令 指令 间 存 在 数据 相关 


D 相隔 1 条 指令 的 指令 间 存 在 数据 相关 


考虑 如 下 代码 。 
1 ori $1,$0,0x1100 # $1 = $0 | 0x1100 = 0x1100 
2 ori $3,$0,0xffff # $3 = $0 | Oxffff = Oxffff 
3 ori $2,$1,0x0020 # $2 = $1 | 0x0020 = 0x1120 


第 1 条 ori 指 令 将 写 寄 存 器 $1， 第 3 条 ori 指 令 在 译 码 阶段 需要 读 取 寄 
存 器 $1， 此 时 第 1 条 ori 指 令 还 处 于 访 存 阶段 ， 所 以 得 到 的 必然 也 不 是 正 
确 的 值 。 如 图 5-2 所 示 ， 这 种 情况 可 以 称 为 相隔 1 条 指令 的 指令 间 存 在 数 
据 相 关 ， 针 对 OpenMIPS 的 具体 情况 ， 也 可 以 称 为 流水 线 译 码 、 访 存 阶 
段 存在 数据 相关 。 


第 1 条 


ori 指 令 将 在 回 写 阶段 最 后 


AS 
/的 时 钟 上 升 沿 把 运算 结果 写 入 $1 


y 
/ 





A 


PL ay 





pi x, 
1 ori $1,80,0x1100 < 取 指 x 详 码 x 执行 x 访 存 x 回 写 > 





N 


ori $3,$0,0xffff aan > 详 码 > 执行 >C 访 存 E > 





3 ori $2,$1,0x0020 <A << 执行 >< 访 存 > 回 写 > 


第 3 条 ori 指 令 将 在 译 码 阶段 取得 $S1 的 | -一 
值 ， 此 时 得 到 的 不 是 正确 的 值 


图 5-2 ”相隔 1 条 指令 的 指令 间 存 在 数据 相关 
© 相隔 2 条 指令 的 指令 间 存 在 数据 相关 
考虑 如 下 代码 。 


工 ori $1,$0,0x1100 # $1 = $0 | 0x1100 = 
2 ori $3,$0,0xffff # $3 = $0 | Oxffff = 
3 ori $4,$0,0xffff # $4 = $0 | Oxffff = 
4 ori $2,$1,0x0020 # $2 = $1 | 0x0020 = 


0x1100 
Oxf fff 
Oxf fff 
0x1120 


第 1 条 ori 指 令 将 写 寄 存 器 $1， 第 4 条 ori 指 令 在 译 码 阶段 需要 读 取 寄 
存 器 $1， 此 时 第 1 条 指令 处 于 回 写 阶段 ， 在 回 写 阶段 最 后 的 时 钟 上 升 沿 
才 会 将 运算 结果 写 入 $1， 所 以 第 4 条 ori 指 令 得 到 的 不 是 正确 的 寄存 器 $1 
的 值 。 如 图 5-3 所 示 ， 这 种 情况 可 以 称 为 相隔 2 条 指令 的 指令 间 存 在 数据 
相关 ， 针 对 OpenMIPS 的 具体 情况 ， 也 可 以 称 为 流水 线 译 码 、 回 写 阶段 


存在 数据 相关 。 


第 1 条 ori 指 令 将 在 回 写 阶段 最 后 
的 时 钟 上 升 沿 将 运算 结果 写 入 $1 





ew f U U WU W U WU U WU 
1 ori $1,$0,0x1100 < Hi > REOL WEL tit E > 
2 ori $3,$0,0xffff TE HE ME te <I > 
3 ori $4,$0,0xfFFF <a x x > E 
4 ori $2,$1,0x0020 <a> CAME xt LIS > 


第 4 条 ori 指 令 将 在 译 但 阶 段 取 得 $1 的 
值 ， 此 时 得 到 的 不 是 正确 的 值 


图 5-3 ”相隔 2 条 指令 的 指令 间 存 在 数据 相关 
































其 中 ， 相 隔 2 条 指令 存在 数据 相关 《 即 流水 线 译 码 、 回 写 阶段 存在 
数据 相关 ) 这 种 情况 ， 在 第 4 章 设计 的 Regfile 模 块 中 己 经 得 到 了 解决 ， 
Regfile 模 块 部 分 代码 如 下 。 














在 读 操 作 中 有 一 个 判断 ， 如 果 要 读 取 的 寄存 器 是 在 下 一 个 时 钟 上 升 
沿 要 写 入 的 寄存 器 ， 那 么 就 将 要 写 入 的 数据 直接 作为 结果 输出 。 如 此 就 
解决 了 相隔 2 条 指令 存在 数据 相关 的 情况 。 


对 于 相 邻 指令 间 存 在 数据 相关 、 相 隔 1 条 指令 的 指令 间 存 在 数据 相 
关 这 两 种 情况 ， 有 三 种 解决 方法 。 


Q ”插入 暂停 周期 ， 当 检测 到 相关 时 ， 在 流水 线 中 插入 一 些 暂 停 周 
期 ， 如 图 5-4 所 示 。 





/ 








1 ori $1,80,0x1100 < 取 指 > Pe >< 执行 x 访 存 xls 
2 ori $2,$1,0x0020 取 指 SH > 执行 > 访 在 > 回 写 
插入 暂停 周期 | 


图 5-4 在 流水 线 中 插入 暂停 周期 消除 数据 相关 





Q) 编译 器 调度 : 编译 器 检测 到 相关 后 ， 可 以 改变 部 分 指令 的 执行 
顺序 ， 如 图 5-5 所 示 。 




















ori $1, $0, 0x1100 ori $1, $0, 0x1100 
ori $2, $1, 0x0020 ori $4, $3, Oxffff 
ori $4, $3, Oxffff ori $6, $5, Ox00ff 
ori $6, $5, Ox00ff ori $2, $1, 0x0020 

存在 数据 相关 消除 数据 相关 


图 5-5 ”编译 器 通过 改变 指令 执行 顺序 消除 相关 


© 数据 前 推 : 将 计算 结果 从 其 产生 处 直接 送 到 其 他 指令 需要 处 或 
所 有 需要 的 功能 单元 处 ， 避 免 流 水 线 和 暂停 。 如 图 5-6 所 示 的 例子 中 ， 新 
的 $1 值 实际 上 在 第 1 条 ori 指 令 的 执行 阶段 已 经 计算 出 来 了 ， 可 以 直接 将 
该 值 从 第 1 条 ori 指 令 的 执行 阶段 送 入 第 2 条 ori 指 令 的 译 码 阶段 ， 从 而 使 
第 2 条 ori 指 令 在 译 码 阶段 得 到 $1 的 新 值 。 也 可 以 直接 将 该 值 从 第 1 条 ori 
旨 令 的 访 存 阶段 送 入 第 3 条 ori 指 令 的 译 码 阶段 ， 从 而 使 第 3 条 ori 指 令 在 
译 码 阶段 也 得 到 $1 的 新 值 。 


1 ori $1,$0,0x1100 < 取 指 译 码 执行 访 存 回 写 


























2 ori$2,$1,0x0020 < W4 PERS HT 访 存 回 写 








3 ori $3,$1,0x4400 取 指 译 码 执行 访 存 回 写 





图 5-6 数据 前 推 解决 流水 线 相关 





读者 需要 注意 ， 第 @3) 种 方法 有 一 个 前 提 就 是 新 的 寄存 器 的 值 可 以 在 
执行 阶段 计算 出 来 ， 如 果 是 加 载 指 令 ， 那 么 束 不 满足 这 个 前 提 ， 因 为 加 
载 指令 在 访 存 阶段 才能 获得 最 终结 果 ， 这 是 一 种 load 相 关 ， 本 书 将 在 实 
现 加 载 存 储 指令 的 时 候 考虑 这 种 情况 ， 本 章 暂 不 考虑 。 


5.2 OpenMIPS 对 数据 相关 问题 的 
RRR Te itt 


OpenMIPS 处 理 器 采用 数据 前 推 的 方法 来 解决 流水 线 数据 相关 问 
题 。 通 过 补充 完善 图 4-4 原 始 的 数据 流 图 ， 添 加 部 分 信号 使 得 可 以 完成 
数据 前 推 的 工作 ， 如 图 5-7 所 示 。 主 要 是 将 执行 阶段 的 结果 、 访 存 阶段 
的 结果 前 推 到 译 码 阶段 ， 参 与 译 码 阶段 选择 运算 源 操作 数 的 过 程 。 
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图 5-7 添加 了 数据 前 推 的 0penMIPS 数 据 流 图 





图 5-8 给 出 了 为 实现 数据 前 推 而 对 OpenMIPS 系 统 结构 所 做 的 修改 ， 
具体 有 两 个 方面 。 








译 码 执行 | 沪 存 MS 
























































! 1 i 
ID | EX EX/MEM MEM MEM/WB 
| wdata_o — ex_wdata mem_wdata >| wdata_o > wb_wdata 
| wd_o > ex_wd mem_wd > wd_o > wb_wd 
mp mem_wdata_i | wreg o H ex_wreg mem_wreg }—> wreg_o > wb_wreg 
m~~ mem_wd_i | | i| rst 
m> mem wreg i | IH} | clk mem.v 
> ex_wdata_i | | H ex_mem.v mem_wb.v 
| „BD ex_wd_i rit ! | 
| ex_wreg_i 






























OpenMIPS 结 构图 
| “为 解决 数据 相关 而 做 的 修改 ) 














图 5-8 为 实现 数据 前 推 而 对 0penMIPS 结 构 所 做 的 修改 


$2 


(1) 将 处 于 流水 线 执行 阶段 的 指令 的 运算 结果 ， 包 括 : 是 否 要 写 
目的 寄存 器 wreg _o、 要 写 的 目的 寄存 器 地 址 wd_o、 要 写 入 目的 寄存 器 
的 数据 wdata_o 等 信息 送 到 译 码 阶段 ， 如 图 5-8 中 虚线 所 示 。 


(2) 将 处 于 流水 线 访 存 阶段 的 指令 的 运算 结果 ， 包 括 : LABS 
目的 寄存 器 wreg_o、 要 写 的 目的 寄存 嚣 地址 wd_o、 要 写 入 目的 寄存 器 
的 数据 wdata_o 等 信息 送 到 译 码 阶段 。 





为 此 ， 译 人 码 阶段 的 如 模块 要 增加 如 表 5-1 所 示 的 接口 。 


表 5-1 1D 模 块 要 增加 的 接口 


接口 名 | 宽度 (bit) | mame 作 用 


ex wdata i 32 i -执行 阶段 的 指令 要 写 入 目的 寄存 器 的 数据 


5 mem wd i 5 fl - 访 存 阶段 的 指令 要 写 的 目的 寄存 器 地 址 
6 mem wdata i | 32 fl 于 访 存 阶 段 的 指令 要 写 入 目的 寄存 器 的 数据 


译 码 阶段 的 ID 模块 会 依据 送 入 的 信息 ， 进 行 综合 判断 ， 解 决 数据 相 





















































关 ， 给 出 最 后 要 参与 运算 的 操作 数 。ID 模 块 的 代码 要 做 如 下 修改 ， 其 中 
主要 的 修改 部 分 使 用 加 粗 、 和 斜体 表示 。 修 改 后 的 代码 位 于 本 书 光 盘 中 
Code\Chapter5_1 目 录 下 的 id.v 文 件 。 


























除了 修改 译 码 阶段 ID 模块 的 代码 ， 还 要 修改 顶层 模块 OpenMIPS 对 
应 的 代码 ， 在 其 中 增加 图 5-8 所 示 的 连接 关系 。 具 体 修改 过 程 不 在 书 中 
列 出 ， 读 者 可 以 参考 本 书 附带 光盘 中 Code\Chapter5_1 目 录 下 的 
openmips.v 文 件 。 


5.3 训 试 数据 相关 问题 的 解决 效 来 


测试 程序 如 下 ， 其 中 存在 5.1 节 讨论 的 RAW 相关 的 三 种 情况 ， 源 文 
件 是 本 书 附带 光盘 中 Code\Chapter5_1\AsmTest 目 录 下 的 inst_rom.S 文 
件 。 


.org 0x0 
.global _start 


,Set noat 

_start: 
ori $1,$0,0x1100 # $1 = $0 | 0x1100 = 0x1100 
ori $1,$1,0x0020 # $1 = $1 | 0x0020 = 0x1120 
ori $1,$1,0x4400 # $1 = $1 | 0x4400 = 0x5520 
ori $1,$1,0x0044 # $1 = $1 | 0x0044 = 0x5564 


指令 的 注释 给 出 了 预期 执行 效果 。 将 上 述 inst_rom.S 文 件 与 第 4 章 实 
现 的 Bin2Mem.exe、Makefile、ram.1d 这 三 个 文件 复制 到 Ubuntu 虚拟 机 中 
的 同一 个 目录 下 ， 打 开 终 端 ， 使 用 cd 命令 进入 该 目录 ， 然 后 输入 make 
all， 即 可 得 到 能 够 用 于 ModelSim 仿 真 的 inst_rom.data 文 件 。 


在 ModelSim 中 新 建 一 个 工程 ， 添 加 本 书 附带 光盘 中 
Code\Chapter5_1 目 录 下 的 所 有 .v 文 件 ， 然 后 可 以 编译 。 再 将 上 面 得 到 的 
inst_rom.data 文 件 复制 人 到 ModelSim 工 程 的 目录 下 ， 束 可 以 进行 仿真 了 。 
ModelSim 中 新 建 工程 、 仿 真 的 详细 步骤 可 以 参考 第 2 章 。 





运行 仿真 ， 观 察 寄 存 器 $1 值 的 变化 ， 如 图 5-9 所 示 ，$1 的 变化 符合 


预期 ， 所 以 修改 后 的 OpenMIPS 正 确 解决 了 数据 相关 问题 。 


| D 取 到 的 指令 


























® rst sto 

® ck Stl | | | | | l | l | l | l | l | l | l E 
8 @ if_inst XX.. ¥34011100 }34210020 {34214400 |34210044 } 
1-4 regfilei/regs[1] |00... {00001100 }00001120 加 0005520 加 0005564 


(2) $1 的 值 从 0x00001100 最 终 变 为 0x00005564， 符 合 预期 V 


图 5-9 ModelSim 仿 真 结果 ， 显 示 $1 的 变化 符合 预期 


5.4 逻辑 、 移 位 操作 与 空 指令 说 明 


MIPS32 指 令 集 架构 中 定义 的 逻辑 操作 指令 有 8 条 : and, andi, ors 
ori、xor、xXori、nor、lui， 其 中 ori 指 令 己 经 实现 了 本 章 要 实现 的 其 余 7 条 
LA 
EP o 


MIPS32 指 令 集 架构 中 定义 的 移 位 操作 指令 有 6 条 : sll. sllv, sra, 


srav、 srl、srlv。 


MIPS32 指 令 集 架构 中 定义 的 空 指令 有 2 条 : nop、ssnop。 其 中 ssnop 
是 一 种 特殊 类 型 的 空 操 作 ， 在 每 个 周期 发 射 多 条 指令 的 CPU 中 ， 使 用 
SSnop 指 令 可 以 确保 单独 占用 一 个 发 射 周 期 。OpenMIPS 设 计 为 标量 处 理 
器 ， 也 就 是 每 个 周期 发 射 一 条 指令 ， 所 以 ssnop 的 作用 与 nop 相 同 ， 可 以 
按照 nop 指 令 的 处 理 方 式 来 处 理 ssnop 指 令 。 


另外 ，MIPS32 指 令 集 架构 中 还 定义 了 sync、Ppref 这 2 条 指令 ， 其 中 
sync 指 令 用 于 保证 加 载 、 存 储 操 作 的 顺序 ， 对 于 OpenMIPS 而 言 ， 是 严 
格 按照 指令 顺序 执行 的 ， 加 载 、 存 储 操 作 也 是 按照 顺序 进行 的 ， 所 以 可 
以 将 Sync 指令 当 作 nop 指 令 处 理 ， 在 这 里 将 其 归纳 为 空 指令 。pref 指 令 用 
于 绥 存 预 取 ，OpenMIPS 没 有 实现 缓存 ， 所 以 也 可 以 将 pref 指 令 当 作 mop 
指令 处 理 ， 此 处 也 将 其 归纳 为 空 指令 。 


以 上 17 条 指令 按照 格式 、 作 用 的 不 同 ， 又 可 分 为 几 类 ， 分 别 说 明 如 
Fs 


1. and, or, xor, nor 


这 4 条 指令 的 格式 如 图 5-10 所 示 ， 从 图 中 可 以 发 现 ， 这 4 条 指令 都 是 
R 类 型 指令 ， 并 且 指 令 码 都 是 6b000000， 也 就 是 MIPS32 指 令 集 架构 中 定 
义 的 SPECIAL 类 。 此 外 ， 第 6 一 10bit 都 为 0， 需 要 依据 指令 中 第 0 一 5bit 功 
能 码 的 值 进一步 判断 是 哪 一 种 指令 。 

















31 26 25 21 20 16 15 11 10 6 5 0 
Te de rt rd 00000 ne and 指 令 
000000 | = rt rd 00000 | OR | or 指令 
poo = rt rd 00000 EA xor 指 令 
| & rt rd 00000 peed nor 指 令 























图 5-10 and、or、xor、nor 指 令 格 式 
。 当 功 能 码 是 6b100100 时 ， 表 示 是 and 指 令 ， 逻 辑 “ 与 ”运算 。 
指令 用 法 为 : and rd, rs, rto 


指令 作用 为 : rd <- rs AND rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 
为 rt 的 通用 寄存 器 的 值 进行 逻辑 “与 ?运算 ， 运 算 结果 保存 到 地 址 为 rd 的 
通用 寄存 器 中 。 





e 当 功 能 码 是 6b100101 时 ， 表 示 是 or 指令 ， 逻 辑 “ 或 ”运算 。 
站 令 用 法 为 : or rd, rs, rt. 


虽 令 作用 为 : rd <- rs OR rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 
rt 的 通用 寄存 莫 的 值 进 行 逻 辑 “ 或 ”运算 ， 运 算 结果 保存 到 地 址 为 rd 的 通 
用 寄存 器 中 。 


e 当 功 能 码 是 6b100110 时 ， 表 示 是 xor 指 令 ， 异 或 运算 。 
指令 用 法 为 : xor rd, rs, rto 


指令 作用 为 : rd <- rs XOR rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 
为 rt 的 通用 寄存 占 的 值 进行 逻辑 “ 异 或 运算， 运算 结果 保存 到 地 址 为 rd 
的 通用 寄存 器 中 。 

e 当 功 能 人 码 是 6b100111 时 ， 表 示 是 nor 指 令 ， 或 非 运算 。 
站 令 用 法 为 : nor rd, rs, rt. 
指令 作用 为 : rd <- rs NOR rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 ， 与 地 


址 为 rt 的 通用 寄存 器 的 值 进 行 馆 辑 * 或 非 ?运算 ， 运 算 结果 保存 到 地 址 为 
rd 的 通用 寄存 器 中 。 


2. andi, xorij5 2 
这 2 条 指令 的 格式 如 图 5-11 所 示 ， 从 图 5-11 中 可 以 发 现 这 2 条 指令 都 


I 类 型 指令 ， 可 以 依据 指令 中 第 26 一 31bit 指 令 码 的 值 判断 是 哪 一 种 指 


o 
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IE 
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31 26 25 21 20 16 15 0 











ANDI EN 
001100 TS rt immediate andi 指 令 
XORI N 
001110 TS rt immediate xori 指 令 

















图 5-11 andi, xori KeK A 


e 3521566001100, KrnreandidH>, WHR Hise. 


站 令 用 法 为 : andi rt, rs, immediate. 
指令 作用 为 : rt <- rs AND zero_extended(immediate)， 将 地 址 为 rs 的 
通用 寄存 器 的 值 与 指令 中 立即 数 进行 零 扩 展 后 的 值 进行 逻辑 “与 ”运算 ， 
运算 结果 保存 到 地 址 为 rt 的 通用 寄存 器 中 。 





e 当 指 令 码 是 6b001110， 表 示 是 xori 指 令 ， 异 或 运算 。 
指令 用 法 为 : xori rt, rs, immediate. 


SEHHX: rt <- rs XOR zero_extended(immediate)， 将 地 址 为 rs 的 
通用 寄存 器 的 值 与 指令 中 立即 数 进行 零 扩 展 后 的 值 进行 逮 辑 “有 姑 或 " 运 
算 ， 运 算 结果 保存 到 地 址 为 rt 的 通用 寄存 器 中 。 





3. lui 4 


lui 指 令 的 格式 如 图 5-12 所 示 ， 从 图 中 可 以 发 现 lui 指 令 是 I 类 型 指 
令 ， 可 以 依据 指令 中 第 26 一 31bit 指 令 码 的 值 是 否 为 6b001111， 从 而 判 
断 是 否 是 lui 指 令 。 


31 26 25 21 20 16 15 0 











LUI 


001111 00000 rt immediate 




















图 5-12 ”1ui 指 令 格式 
令 用 法 为 : lui rt, immediate. 


指令 作用 为 : rt <- immediate || 0'° ， 将 指令 中 的 16bit 立 即 数 保存 到 
地 址 为 rt 的 通用 寄存 器 的 高 1 位 。 愉 外， 地 址 为 rt 的 通用 寄存 圳 的 低 16 


位 使 用 0 填充 。 
4. sll、sllv、sra、srav、srl、srlv 指 令 
这 6 条 指令 的 格式 如 图 5-13 所 示 ， 从 图 5-13 中 可 以 发 现 这 6 条 指令 都 


是 R 类 型 指令 ， 并 且 指 令 码 都 是 6b000000。 也 就 是 说 ， 都 是 SPECIAL 
类 ， 需 要 依据 指令 中 第 0 一 5bit 功 能 码 的 值 进一步 判断 是 哪 一 种 指令 。 























31 26 25 21 20 16 15 11 10 6 5 0 

SPECIAL | 00000 a y ds Ea sl 指令 
al | 2 | ow | om | SA, | wate 
sea] oo | SEN | te 
a ra rt rd 00000 eee srlv 指 令 


























图 5-13 sl1、srl、sra、sllv、srlv、srav 指 令 格 式 





e 当 功 能 码 是 6b000000， 表 示 是 sl 指令， 逻辑 左 移 。 
指令 用 法 为 : sll rd, rt, sao 


指令 作用 为 : rd <- rt << sa (logic)， 将 地 址 为 rt 的 通用 寄存 器 的 值 向 
左 移 sa 位 ， 空 出 来 的 位 置 使 用 0 填充 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄存 圳 
中 。 





。 当 功 能 码 是 6b000010， 表 示 是 srl 指 令 ， 逻 辑 右 移 。 


指令 用 法 为 : srl rd, rt, sao 


站 令 作用 为 :rd <- rt >> sa (logic)， 将 地 址 为 rt 的 通用 寄存 器 的 值 同 
右 移 sa 位 ， 空 出 来 的 位 置 使 用 0 填充 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄存 器 
中 。 





。 当 功 能 码 是 6b000011， 表 示 是 sra 指 令 ， 算 术 右 移 。 
站 令 用 法 为 : sra rd, rt, Sao 


指令 作用 为 : rd <- rt >> sa (arithmetic)， 将 地 址 为 rt 的 通用 寄存 器 的 
值 同 右 移 sa 位 ， 空 出 来 的 位 置 使 用 rt[31] 的 值 填充 ， 结 果 保 存 到 地 址 为 rd 
的 通用 寄存 器 中 。 





e 当 功 能 码 是 6b000100， 表 示 是 sllv 指 令 ， 逻 辑 左 移 。 
ES HEM: sllv rd, rt, rs. 


指令 作用 为 : rd <- rt << rs[4:0](logic)， 将 地 址 为 rt 的 通用 寄存 占 的 
值 回 左 移 位 ， 空 出 来 的 位 置 使 用 0 填充 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄 
存 器 中 。 移 位 位 数 由 地 址 为 rs 的 寄存 器 值 的 第 0 一 4bit 确 定 。 





e 当 功 能 码 是 6b000110， 表 示 是 srlv 指 令 ， 逻 辑 右 移 。 
指令 用 法 为 : srlv rd, tt, rs。 


站 令 作用 为 : rd <- rt >> rs[4:0](ogicCj)， 将 地 址 为 rt 的 通用 寄存 器 的 
值 癌 右 移 位 ， 衬 出 来 的 位 置 使 用 0 填充 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄 
存 器 中 。 移 位 位 数 由 地 址 为 rs 的 寄存 器 值 的 第 0 一 4bit 确 定 。 


e 当 功 能 码 是 6b000111， 表 示 是 srav 指 令 ， 算 术 右 移 。 





站 令 用 法 为 : srav rd, rt, rs. 


日 令 作 用 为 : rd <- rt >> rs[4:0](arithmetic)， 将 地 址 为 rt 的 通用 寄存 
器 的 值 回 右 移 位 ， 空 出 来 的 位 置 使 用 rt[31] 填 充 ， 结 果 保 存 到 地 址 为 rd 的 
通用 寄存 器 中 。 移 位 位 数 由 地 址 为 rs 的 寄存 器 值 的 第 0 一 4bit 确 定 。 


总 结 来 说 ， 这 6 条 移 位 操作 指令 可 以 分 为 两 种 情况 : sllv、srav、srlv 
这 3 条 指令 的 助 记 符 最 后 有 “v”"， 表 示 移 位 位 数 是 通过 寄存 器 的 值 确定 
的 ，sll、sra、sl 这 3 条 指令 的 助 记 符 最 后 没有 “v”， 表 示 移 位 位 数 就 是 指 


令 中 第 6 一 10bit 的 sa 值 。 











5. nop、ssnop、sync、Ppref 指 令 


这 4 条 指令 的 格式 如 图 5-14 所 示 。 从 图 5-14 中 可 以 发 现 nop、Sssnop、 
sync 这 3 条 指令 都 是 R 类 型 指令 ， 并 且 指 令 码 都 是 6b000000， 也 就 是 说 ， 
都 是 SPECIAL 类 。 























31 26 25 21 20 16 15 Il 10 65 0 
sra 00 | 00000 | 00000 | 00000 | 00000 了 o | nop 指 令 
SPECIAL 00000 | 00000 | 00000 | 00001 ee o | ssnop 指 令 
spoons, | 00000 | 00000 | 00000 | 00001 SYNC | sync 指 令 

or i 1 base hint offset pref 指 令 




















图 5-14 nop、ssnop、sync、pref 指 令 的 格式 
更 进一步 可 以 发 现 ，nop、ssnop 两 条 指令 的 功能 码 都 是 6b000000， 


与 之 前 介绍 的 逻辑 左 移 指令 sl 的 功能 码 相 同 ， 这 样 在 译 码 的 时 候 会 不 会 
有 冲突 ; nop 指 令 的 二 进 制 码 与 sll $0,$0,0 的 三 进 制 码 一 样 ， 处 理 器 如 何 


AS? ssnop 指 令 的 二 进 制 码 与 sl $0,$0,1 的 二 进 制 码 一 样 ， 处 理 磺 如 何 
ERG? 


nop = sll $0,$0,0 
ssnop = sll $0,$0,1 


其 实 两 者 是 等 价 的 ，sll 指 令 向 $0 寄存 器 保存 移 位 结果 ， 实 际 不 会 有 
任何 效果 ， 因 为 无 论 向 $0 写 任何 数 ， 其 值 始 终 为 0， 所 以 效果 等 同 于 什 
么 都 不 做 ， 这 也 正 是 空 指令 nop、ssnop 的 效果 。 所 以 nop、ssnop 指 令 不 
用 特意 实现 ， 完 全 可 以 当 作 特殊 的 逻辑 左 移 指 令 sll。 


5.5 ”修改 OpenMIPS 以 实现 逻辑 、 
移 位 操作 与 空 指令 
为 了 实现 逻辑 、 移 位 操作 与 空 指 令 〈( 其 中 nop、ssnop 不 用 特意 实 


现 ， 可 以 认为 是 特殊 的 逻辑 左 移 指令 sll) ， 只 需要 修改 OpenMIPS 的 如 
下 两 个 模块 。 


e 修改 译 码 阶段 的 模块 ， 用 以 实现 对 上 述 指令 的 译 码 。 
© 修改 执行 阶段 的 EX 模块 ， 使 其 按照 译 码 结果 进行 运算 。 


5.5.1 修改 译 码 阶段 的 ID 模块 


首先 给 出 如 下 宏 定 义 ， 都 在 文件 defines.v 中 定义 ， 读 者 可 以 在 本 书 
附带 光盘 中 Code\Chapter5_ 2 目录 下 找到 该 文件 。 


“define EXE AND 6'b100100 //and 指 令 的 功能 码 
“define EXE OR 6'b100101 //or 指 令 的 功能 码 

“define EXE XOR 6'b100110 //Xxor 指 令 的 功能 码 
“define EXE_ NOR 6'b100111 //nor 指 令 的 功能 码 
‘define EXE_ANDI 6'b001100 /Vandi 指 令 的 指令 码 
“define EXE_ORI 6'b001101 /V/ori 指 令 的 指令 码 
“define EXE_XORI 6'b001110 //Xxori 指 令 的 指令 码 
“define EXE_LUI 6'b001111 //lui 40148 48 


“define EXE SLL 6'b000000 //Sl1l1 指 令 的 功能 人 码 





对 指令 进行 译 码 的 前 提 是 能 判断 出 指令 种 类 ， 这 个 过 程 如 图 5-15 所 
示 。 其 中 op 就 是 指令 的 第 26 一 31bit， 即 指令 码 ，op2 就 是 指令 的 第 6 一 10 
bit，op3 就 是 指令 的 第 0~~5bit， 即 功能 码 ，op4 就 是 指令 的 第 16~20bit， 
定义 如 下 。 














































































































































































































=EXE_SPFCTAL_TNST =e =EXE_OR 
op >» op2 > op3 > or 指令 
-= EXE_AND 
= and 指 令 
=EXE_ORI =EXE_XOR 
~ > ori > = 其 它 一 一 一 一 > xor 指 令 
= EXE_ANDI = EXE_NOR 
= andi 指 令 ral 一 一 一 一 > nor 指令 
—EXE XORI - EXE_SLLV 
= xori 指 令 无 效 指令 m sllv 指 令 
= EXE_LUI =EXE_SRLV 
= lui 指 令 一 一 一 一 > srlv 指 令 
= EXE_PREF =EXE_SRAV 
= pref 指 令 一 一 一 一 >| srav 指 令 
HE 无 效 指令 PEN, sync 指 令 
= 其 它 
一 | 无 效 指令 
— =0 =EXE_STI. - 
inst_i[31:21] ==> op3 > sll 指 令 wire[5:0] op = inst_i[31:26]; 
= EXE_SRL ZN wire[4:0] op2 = inst_i[10:6]; 
m ES Sa 
-EXE SRA | op3 = inst_i[5:0]; 








sra 指 令 wire[4:0] op4 = inst_i[20:16]; 





图 5-15 确定 指令 种 类 的 过 程 


首先 依据 指令 码 op 进 行 判断 ， 如 果 是 SPECIAL 类 指令 ， 再 判断 指令 
的 第 6 一 10bit( 即 op2〉 是 否 为 0， 如 果 为 0， 那 么 再 依据 功能 码 op3 的 
值 ， 进 行 最 终 判 断 ， 确 定 指令 类 型 。 如 果 指 令 码 op 不 为 SPECIAL， 那 么 
就 直接 依据 指令 码 op 的 值 进行 判断 。 


只 有 在 确定 指令 sll、srl、sra 的 时 候 有 一 点 特殊 ， 从 图 5-13 可 知 ， 这 
3 条 指令 都 是 SPECIAL 类 指令 ， 但 是 这 3 条 指令 还 要 求 第 21 一 25bit 为 0， 
而 且 第 6 一 10bit 为 移 位 位 数 ， 所 以 这 3 条 指令 的 判断 过 程 是 : 判断 指令 的 
第 21 一 31bit 是 否 全 为 0， 如 果 全 为 0， 那 么 再 依据 功能 码 op3 进 行 最 终 判 
Wt, BARE TESA 。 





ID 模块 主要 修改 内 容 如 下 ， 完 整 的 代码 可 以 参考 本 书 附带 光盘 中 
Code\Chapter5_2 目 录 下 的 id.v 文 件 。 


module id( 







































































第 6 草 ”移动 操作 指令 的 实现 


本 章 将 实现 移动 操作 指令 ， 首 先 在 6.1 节 介绍 了 MIPS32 指 令 集 染 构 
中 定义 的 移动 操作 指令 的 格式 、 作 用 ， 接 着 在 6.2 节 给 出 移动 操作 指令 
的 实现 思路 ， 介 绍 了 修改 后 的 数据 流 图 、 新 出 现 的 数据 相关 问题 及 其 解 
决 措施 ， 并 给 出 了 修改 后 的 OpenMIPS 系 统 结构 图 。 在 6.3 节 列 出 了 详细 
的 修改 过 程 。 本 章 最 后 通过 一 个 测试 程序 验证 移动 操作 指令 是 否 正确 实 
现 。 





6.1 ”移动 操作 指令 说 明 


MIPS32 指 令 集 架构 中 定义 的 移动 操作 指令 共有 6 条 : movn、 
movz、mfhi、mthi、mflo、mtlo， 后 4 条 指令 涉及 对 特殊 寄存 器 HI、LO 
的 读 / 写 操作 。 截 止 到 本 章 ， 我 们 的 OpenMIPS 处 理 器 只 实现 了 32 个 通用 
寄存 器 以 及 PC， 所 有 的 指令 也 只 是 对 32 个 通用 寄存 器 进行 操作 ， 还 没 
有 涉及 特殊 寄存 器 ， 本 章 将 实现 HI、LO 这 两 个 特殊 寄存 器 。 





HI、LO 寄 存 器 用 于 保存 乘法 、 除 法 结果 。 当 用 于 保存 乘法 结果 
时 ，HI 寄 存 器 保存 结果 的 高 32 位 ，LO 寄 存 器 保存 结果 的 低 32 位 ， 当 用 
于 保存 除法 结果 时 ，HI 寄 存 器 保存 余数 ，LO 和 寄存器 保存 商 。 在 后 续 “ 算 
术 操 作 指 令 的 实现 ”一 章 中 ， 会 进一步 说 明 。 


这 6 条 移动 操作 指令 的 格式 如 图 6-1 所 示 。 












































31 26 25 21 20 16 15 11 10 6 5 0 
oo S rt rd 00000 A | movn 指 令 
“nou || ® rt rd 00000 | | movz 指 令 
SPECIAL | 00000 | 00000 rd 00000 D40000 | mfhi 指 令 
on | 00000 | 00000 rd 00000 MTO | moig 
rea 00000 | 00000 | 00000 DAR | mthi 指 令 
a 00000 | 00000 | 00000 wool, | mtlo 指 令 


图 6-1 移动 操作 指令 的 格式 





从 图 6-1 可 知 ， 这 6 条 指令 都 是 R 类 型 指令 ， 并 且 指 令 码 都 是 


6b000000， 即 均 为 SPECIAL 类 指令 ， 同 时 ， 指 令 第 6 一 10bit 都 为 0， 可 
以 依据 指令 中 第 0 一 5bit 功 能 码 的 值 判断 是 哪 一 种 指令 。 各 指令 的 用 法 及 
作用 说 明 如 下 。 





。 当 功 能 码 为 6b001011 时 ， 表 示 是 movn 指 令 。 
SOMEN: mov rd, rs, rt. 


指令 作用 为 : if rt #0 then rd <- Is， 判 断 地 址 为 rt 的 通用 寄存 器 的 
值 。 如 果 不 为 零 ， 那 么 将 地 址 为 rs 的 通用 寄存 器 的 值 赋 给 地 址 为 rd 的 通 
用 寄存 器 ; 反之 ， 保 持 地 址 为 rd 的 通用 寄存 器 不 变 。movn 是 Move 


Conditional on Not Zero 的 意思 。 
e 当 功 能 码 为 6b001010 时 ， 表 示 是 movz 指 令 。 
EHEN: movz rd, rs, rto 


指令 作用 为 : if rt = 0 then rd <- rs， 与 上 面 movn 指 令 的 作用 正好 相 
反 ， 判 断 地 址 为 rt 的 通用 寄存 器 的 值 。 如 果 为 零 ， 那 么 将 地 址 为 rs 的 通 
用 寄存 器 的 值 赋 给 地 址 为 rd 的 通用 寄存 器 ;， 反之 ， 保 持 地 址 为 rd 的 通用 


寄存 器 不 变 。movz 是 Move Conditional on Zero 的 意思 。 
e 当 功 能 码 为 6b010000 时 ， 表 示 是 mfhi 指 令 。 
间 令 用 法 为 : mfhi rd. 


SEHN: rd <- hi， 将 特殊 寄存 器 HI 的 值 赋 给 地 址 为 rd 的 通用 寄 
FEAF o 


e 当 功 能 码 为 6b010010 时 ， 表 示 是 mflo 指 令 。 


指令 用 法 为 : mflo rd。 


间 令 作用 为 : rd <- 1o， 将 特殊 寄存 器 LO 的 值 赋 给 地 址 为 rd 的 通用 寄 
FEAF o 





e 当 功 能 码 为 6b010001 时 ， 表 示 是 mthi 指 令 。 
指令 用 法 为 : mthi rs。 


指令 作用 为 : hi <- rs， 将 地 址 为 rs 的 通用 寄存 器 的 值 赋 给 特殊 寄存 
器 HI。 





e 当 功 能 码 为 6b010011 时 ， 表 示 是 mtlo 指 令 。 
指令 用 法 为 : mtlo rs。 


ERA: lo <- rs， 将 地 址 为 rs 的 通用 寄存 器 的 值 赋 给 特殊 寄存 
器 LO。 





6.2 ”移动 操作 指令 实现 思路 


这 6 条 移动 操作 指令 可 以 分 为 两 类 : 一 类 是 不 涉及 特殊 寄存 器 HI、 
LO 的 指令 ， 包 括 movn、movz; 男 一 类 是 涉及 特殊 寄存 器 HI、LO 的 指 
令 ， 包 括 mfhi、mflo、mthi、mtlo。 前 一 类 很 好 实现 ， 基 本 思路 与 第 5 章 
实现 逻辑 、 移 位 操作 指令 时 类 似 ， 只 需要 修改 ID、EX 模 块 即 可 。 后 一 
类 涉及 特殊 寄存 器 HI、LO， 需 要 为 OpenMIPS 添 加 HI、LO 寄 存 器 ， 以 
及 相应 的 读 / 写 控制 。 下 面 分 别 介绍 各 自 的 实现 思路 。 


1. movn、movz 指 邻 实现 思路 


与 第 5 章 逻 辑 、 移 位 操作 指令 的 实现 过 程 类 似 。 


(1) 在 译 码 阶段 给 出 运算 类 型 alusel o、 运 算 子 类 型 aluop o、 要 写 
入 的 目的 寄存 器 地 址 wd_o 等 信号 的 值 ， 同 时 读 取 地 址 为 rr、rt 的 通用 寄 
存 器 的 值 ， 但 是 这 里 需要 新 增 一 个 步骤 : 依据 读 取 地 址 为 rt 的 通用 寄存 
器 的 值 是 否 为 0， 判 断 是 否 要 写 入 目的 寄存 器 。 将 上 述 结果 送 到 执行 阶 
BY 




















(2) 执行 阶段 依据 传 入 的 信号 ， 确 定 最 终 要 写 入 目的 寄存 器 的 信 
a (BR: 是 人 否 写 、 写 入 的 目的 寄存 需 地 址 、 写 入 的 值 ) ， 并 将 这 些 信 
奶 传 递 到 访 存 阶段 。 








(3) 上 述 信息 会 一 直 传 递 到 回 写 阶段 。 最 后 ， 依 据 这 些 信息 修改 
目的 寄存 器 ， 或 者 不 做 任何 修改 。 


2，mthi、mto 指 邻 实 现 思路 





这 2 条 指令 需要 写 HI、LO 寄 存 器 ， 与 之 前 实现 的 通用 寄存 器 一 样 ， 
对 HI、LO 寄 存 器 的 与 操作 放 在 回 写 阶段 进行 。 


(1) 在 译 码 阶段 依据 指令 ， 给 出 运算 类 型 alusel_o、 运 算 子 类 型 
aluop_o 的 值 ， 同 时 读 出 地 址 为 rs 的 通用 寄存 器 的 值 。 由 于 mthi、mtlo 不 
写 通 用 寄存 器 ， 所 以 wreg_o 为 WriteDisable，wd_o 为 0。 


(2) 在 执行 阶段 确定 要 写 HI、LO 寄 存 器 的 情况 ， 以 及 要 写 入 的 
值 ， 并 将 这 些 信息 传递 到 访 存 阶段 。 


(3) 访 存 阶段 将 这 些 信息 再 传递 到 回 写 阶段 。 





(4) 回 写 阶段 依据 这 些 信息 修改 HI、LO 寄 存 器 的 值 。 
3. mfhi、mflo 指 令 实 现 思 路 


这 2 条 指令 需要 读 HI、LO 寄 存 器 ， 设 计 在 执行 阶段 才能 读 取 到 。 


(1) 在 译 码 阶 段 依据 指令 ， 给 出 运算 类 型 alusel_o、 运 算 子 类 型 
aluop_0 的 值 ， 同 时 因为 有 要 写 入 的 目的 寄存 器 ， 所 以 wreg_o0 为 
WriteEnable，wd_o 为 指令 中 rd 的 值 ， 也 束 是 目的 寄存 器 地 址 。 














(2) 在 执行 阶段 获取 HI 或 LO 寄存 占 的 值 ， 作 为 要 写 入 目的 寄存 器 
的 数据 ， 并 将 这 些 信息 传递 到 访 存 阶 段 。 


(3) 访 存 阶段 将 这 些 信息 再 传递 到 回 写 阶段 。 


(4) 回 写 阶段 依据 这 些 信息 修 改 目 的 寄存 句 。 


添加 移动 操作 指令 后 的 数据 流 图 如 图 6-2 所 示 ， 
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图 6-2 添加 移动 操作 指令 后 的 数据 流 图 
对 比 图 6-2 与 图 5-7 可 以 及 现 有 如 下 区 别 。 


。 增 加 了 了 HILO 寄存器 模块 ， 并 且 该 模块 放 在 回 写 阶段 。 

e 将 HI、LO 寄 存 器 的 值 传递 到 执行 阶段 ， 在 执行 阶段 增加 了 一 
个 选择 模块 ， 用 于 选择 要 参与 运算 的 数据 ， 如 果 是 mfhi、mflo 
指令 ， 那 么 就 会 选择 传递 过 来 的 HI、LO 寄 存 器 的 值 。 


6.2.1 新 的 数据 相关 情况 的 解决 


进一步 考虑 mfhi、mflo 指 令 的 处 理 过 程 ， 这 2 条 指令 会 在 流水 线 执 
行 阶段 读 取 HI、LO 寄 存 器 的 值 ， 如 果 直 接 采 用 HILO 模 块 给 出 的 HI、LO 
寄存 器 的 值 ， 可 能 不 是 正确 的 HI、LO 寄 存 器 的 值 ， 因 为 此 时 处 于 访 
存 、 回 写 阶 段 的 指令 有 可 能 会 修改 HI、LO 寄 存 器 ， 以 如 下 程序 为 例 。 


1. lui $1,0x0000 # $1 = 0x00000000 
2. lui $2, Oxffff # $1 = Oxffff0000 
3. mthi $0 # hi = 0x00000000 
4. mthi $1 # hi = 0x00000000 
5. mthi $2 # hi = Oxffff0000 
6. mfhi $4 # $4 = oxffff0000 


指令 3、4、5 均 要 修改 HI 寄存 器 ， 当 指令 6 处 于 执行 阶段 时 ， 指 令 5 
处 于 访 存 阶段 ， 指 令 4 处 于 回 写 阶段 ， 而 此 时 HI 寄存 器 的 值 是 指令 3 刚刚 
写 入 的 0x00000000，HILO 模 块 正 是 将 该 值 传 到 执行 阶段 ， 如 果 采 用 这 
个 值 ， 那 么 就 会 出 错 ， 偏 离 程序 设想 ， 正 确 的 值 应 该 是 当前 处 于 访 存 阶 
段 的 指令 5 要 写 的 数据 ， 如 图 6-3 所 示 。 


时 钟 / \ \ \ J \ / \ | \ / | \ / \ / \ / / 


mthi $0 <a x 译 码 x 执行 x 访 存 x 回 写 > 


4. mthi $1 <A MA SLE 


5. mthi $2 Ca x ea x ur Die I alt > 
6. mfhi $4 CHE EE EL 执行 >C 访 存 A 回 写 > 


图 6-3 HI、L0 寄 存 器 带 来 的 数据 相关 示意 图 




















似 甸 相识 ， 是 不 是 ?这 就 是 第 5 章 介 绍 过 的 数据 相关 问题 ， 解 决 措 
施 还 是 使 用 数据 前 推 。 将 处 于 访 存 阶段 、 回 写 阶 段 的 指令 对 HI、LO 寄 
存 器 的 操作 信息 反馈 到 执行 阶段 ， 执 行 阶段 依据 这 些 信 息 ， 确 定 HI、 
LO 寄存 器 的 正确 值 。 


为 此 ， 需 要 修改 数据 流 图 如 图 6-4 所 示 ， 相 比 图 6-3， 主 要 增加 的 部 
分 就 是 将 访 存 阶段 、 回 写 阶 段 的 信息 反馈 到 执行 阶段 ， 输 入 到 执行 阶段 
的 选择 模块 (图 中 粗 线 所 示 〉， 如 果 处 于 执行 阶段 的 是 mfhi、mflo 指 


令 ， 那 么 就 会 从 中 选择 HI、LO 寄 存 器 的 正确 值 。 
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图 6-4 解决 HI、L0 寄 存 器 带 来 的 数据 相关 问题 后 的 数据 流 图 


6.2.2 系统 结构 的 修改 


为 了 实现 移动 操作 指令 需要 对 OpenMIPS 系 统 结构 进行 补充 完善 ， 
主要 修改 如 图 6-5 所 示 。 































































































执行 访 存 | 回 写 
EX EX/MEM MEM MEM/WB HILO 
A hi_i whilo_o Ha ex_whilo mem_whilo > whilo i whilo o >| mem_whilo wb_whilo HP we 
>» loi hi o > ex_hi mem_hi >| hi_i hi_o i mem_hi wh hi | > hii hio 
77 wb_whilo_i lo_o > ex_lo mem_lo > lo i loo >| mem_lo wb_lo Hr | ! ploi loo 
[PP wh hi i HEC 
I => wb lo i memy 11! [elk 
li! —> mem_whilo_i ex_mem.v mem_wb.v | | hilo_reg.v 
| | | >| mem_hi_i | ! | | ! 
| H mem_lo_i | | | 
| | 
| i! id exv i 
11 11 
I 11 
| i 1 | | 























OpenMIPS 结 构图 
(为 实现 移动 操作 指令 而 做 的 修改 》 











图 6-5 “为 实现 移动 操作 指令 而 对 0penMIPS 系 统 结构 所 做 的 修改 


主要 有 有 三 个 方面 。 


(1) 增加 了 HILO 模 块 ， 用 于 实现 HI、LO 寄 存 器 。 


(2) 执行 阶段 的 EX 模块 增加 了 whilo o、hi o、lo_o 接 口 ， 分 别 表 
示 是 否 要 写 HILO、 要 写 入 HI 寄存 器 的 值 、 要 写 入 LO 寄存 器 的 值 。 这 三 
个 接口 传递 出 来 的 对 HI、LO 寄 存 器 的 修改 信息 会 通过 EX/MEM、 
MEM、MEM/WB 三 个 模块 一 直 传 递 到 回 写 阶段 ， 并 最 终 传递 给 HILO 模 
块 。 


(3) 执行 阶段 的 EX 模块 增加 了 与 H、LO 寄 存 器 有 关 的 输入 接 
口 ， 包 括 为 解决 HI、LO 寄 存 器 的 数据 相关 问题 而 引入 的 接口 ， 在 6.3.3 
节 会 有 详细 介绍 。 


6.3 人 现 移动 操 
作 指 令 


6.3.1 HI、LO 寄 存 器 的 实现 


在 HILO 模 块 中 实现 HI、LO 寄 存 器 ，HILO 模 块 的 接口 描述 如 表 6-1 
所 示 。 


表 6-1 HILO 模 块 的 接口 





HI, LO 寄存 器 写 使 能 信号 





要 写 入 HI 寄存 器 的 值 
HE A LO 寄存 器 的 值 
HI 寄存 器 的 值 

















HILO 模 块 的 代码 如 下 ， 源 文件 是 本 书 附带 光盘 中 Code\Chapter6 目 
录 下 的 hilo_reg.v。 整 个 代码 很 简单 : 在 时 钟 上 升 沿 ， 如 果 复 位 信号 无 
效 ， 那 么 就 判断 输入 的 写 使 能 信号 we 是 否 为 WriteEnable， 如 果 是 
WriteEnable， 那 么 就 将 输入 的 hi_i、lo_i 的 值 作为 HI、LO 寄 存 器 的 新 
值 ， 并 通过 hi o、lo_o 接 口 输出 。 





module hilo_reg( 


input wire clk, 


6.3.2 ”修改 译 码 阶段 的 ID 模块 





在 译 码 阶段 要 增加 对 移动 操作 指令 的 分 析 ， 根 据 图 6-1 给 出 的 移动 
操作 指令 格式 可 知 ， 这 6 条 指令 都 是 SPECIAL 类 指令 ， 且 第 6 一 10bit 均 为 
0， 需 要 依据 第 0 一 5bit 的 功能 码 确定 指令 ， 确 定 指令 的 过 程 如 图 6-6 所 














= EXE_SPECIAL_INST u = EXE_MOVN 







































































op > op2 op3 >| movn 指 令 
=EXE_MOVZ - 
一 一 一 一 一 > movz 指 今 
= EXE_MTHI 
ee > mthi 指 今 
=EXE MTLO 
mtlo 指 令 
wire[5:0] op = inst_i[31:26]; = EXE_MFHI JEK 
wire[4:0] op2 = inst_i[10:6]; De m 人 hi 指令 
wire[5:0] op3 = inst_i[5:0]; 一 一 一 一 >| mflo 指 今 
wire[4:0] op4 = inst_i[20:16]; 








图 6-6 确定 移动 操作 指令 的 过 程 


其 中 涉及 的 宏 定 义 如 下 ， 正 是 图 6-1 中 各 个 指令 的 功能 码 。 在 本 书 
附带 光盘 中 Code\Chapter6 目 录 下 的 defines.v 文 件 中 可 以 找到 这 些 宏 定 
Mee 


“define EXE_MOVZ 6'b001010 
“define EXE MOVN 6'b001011 
“define EXE_MFHI 6'b010000 
“define EXE_MTHI 6'b010001 
“define EXE MFLO 6'b010010 
“define EXE_MTLO 6'b010011 


译 码 阶 段 的 ID 模块 主要 修改 如 下 。 完 整 代 码 位 于 本 书 附带 光盘 中 
Code\Chapter6 目 录 下 的 id.v 文 件 。 


module id( 

















有 如 下 几 点 说 明 。 


(1) 除 mthi、mtlo 外 的 其 余 4 条 移动 操作 指令 的 运算 类 型 alusel_o 均 
为 EXE_RES_MOVE。 


(2) 指令 mthi、mtlo 需 要 修改 HI、LO 寄 存 器 ， 但 是 不 需要 修改 通 
用 寄存 器 ， 所 以 在 其 译 码 结果 中 ，wreg_o 为 WriteDisable。 另 外 ， 设 置 
regl_read_o 为 1， 表 示 需 要 通过 Regfile 模 块 读 端口 1 读 取 通用 寄存 器 的 
值 ， 默 认 读 取 地 址 就 是 指令 第 21 一 25bit 的 值 ， 正 是 mthi、mtlo 指 令 中 的 


rs。 读 出 的 值 作为 要 写 入 HI 或 LO 寄存 器 的 数据 。 





(3) movz 指 令 的 译 码 过 程 需 要 读 取 rs、rt 寄 存 器 的 值 ， 所 以 设置 
regl_read_o、reg2_read_o 均 为 1。 默 认 通 过 Regfile 模 块 读 问 口 1 读 取 的 寄 
存 器 地 址 regl_addr_o 的 值 是 指令 的 第 21 一 25bit， 正 是 movz 指 令 中 的 rs， 
默认 通过 Regfile 模 块 读 端 口 2 恋 取 的 寄存 器 地 址 reg2_addr_o 的 值 是 指令 
的 第 16 一 20bit， 正 是 movz 指 令 中 的 rt。 所 以 ，reg2_o 的 值 就 是 读 取 到 的 
地 址 为 rt 的 寄存 器 的 值 ， 如 果 该 值 为 0， 那 么 设置 wreg_o 为 WriteEnable， 
表示 要 将 地 址 为 rs 的 寄存 器 的 值 赋 给 地 址 为 rd 的 寄存 器 ， 反 之 ，wreg_0o 
为 WriteDisable， 表 示 不 赋值 。 








(4) movn 指 令 的 译 码 过 程 与 novz 指 令 类 似 ， 只 是 wreg_o 为 
WriteEnable 的 条 件 与 novz 正 好 相反 。 


6.3.3 ”修改 执行 阶段 
1. 修改 EX 模块 


译 码 阶段 的 结果 会 传递 到 执行 阶段 ， 执 行 阶段 据 此 进行 计算 。 考 虑 
到 执行 阶段 需要 读 写 HI、LO 寄 存 器 ， 男 外 还 要 解决 HI[、LO 寄 存 器 带 来 
的 数据 相关 问题 ， 所 以 需要 给 EX 模块 增加 如 表 6-2 所 示 的 接口 。 各 接口 
对 外 连接 关系 可 以 参考 图 6-5。 


表 6-2 EX 模块 要 增加 的 接口 


EX 模块 的 代码 修改 如 下 。 完 整 代码 位 于 本 书 附带 光盘 中 
Code\Chapter6 目 录 下 的 ex.v 文 件 中 。 























endmodule 
上 面 修改 的 代码 可 以 分 为 四 段 理解 。 


(1) 第 一 段 代码 的 作用 是 得 到 最 新 的 HI、LO 寄 存 器 的 值 ， 首 先 判 
断 当 前 处 于 访 存 阶段 的 指令 是 否 要 写 HI、LO 寄 存 器 ， 即 mem_whilo_o 是 
否 为 WriteEnable， 如 果 是 ， 那 么 访 存 阶段 的 指令 要 写 入 的 值 束 是 HI、 
LO 寄存 器 的 最 新 值 ， 如 果 不 是 ， 那 么 再 判断 当前 处 于 回 写 阶 段 的 指令 
是 否 要 写 HI、LO 寄 存 占 ， 如 果 是 ， 那 么 回 写 阶段 的 指令 要 写 入 的 值 束 
是 HI、LO 寄 存 器 的 最 新 值 ， 如 果 不 是 ， 那 么 从 HILO 模 块 输 入 的 值 
hii, lo i 就 是 HI、LO 寄 存 器 的 最 新 值 。 





(2) 第 二 段 代 码 的 作用 是 针对 不 同 的 移动 操作 指令 ， 确 定 moveres 
的 值 ， 变 量 moveres 存 储 的 是 移动 操作 指令 的 结 





(3) 第 三 段 代 码 的 作用 是 依据 运算 类 型 alusel_i 的 值 ， 将 不 同 的 运 
算 结果 赋 给 wdata_o， 如 果 是 移动 操作 指令 ， 那 么 alusel_i 为 
EXE_RES MOVE， 此 时 将 moveres 的 值 赋 给 wdata_o。 


(4) 第 四 有 段 代码 的 作用 是 确定 是 否 要 写 HI、LO 寄 存 器 ， 如 果 是 
mthi、mtlo 寄 存 器 ， 那 么 要 写 HI、LO 寄 存 器 ， 所 以 设置 输出 信和 号 
whilo_o 为 WriteEnable。 具 体 地 说 ， 有 如 下 两 种 情况 。 


。 如 条 是 mthi 指 令 ， 那 么 表示 要 写 HI 寄存 器 ， 所 以 hi_o 等 于 
reg1 i 的 值 ， 参 考 译 码 阶段 的 ID 模 块 可 知 ，reg1_i 的 值 就 是 在 译 
码 阶 段 读 出 的 地 址 为 rs 的 寄存 器 的 值 。 另 外 ，LO 的 值 保 持 不 
变 ， 所 以 lo_o 等 于 LO。 

e 如 果 是 mtlo 指 令 ， 那 么 表示 要 写 LO 寄 存 器 ， 所 以 lo_o 等 于 
reg1 i 的 值 ， 参 考 译 码 阶段 的 ID 模 块 可 知 ，reg1_i 的 值 就 是 在 译 





码 阶段 读 出 的 地 址 为 rs 的 寄存 器 的 值 。 另 外 ，HI 的 值 保持 不 
变 ， 所 以 hi o4 FHI. 


2， 修 改 EX/MEM 模 块 


参考 图 6-5，EX 模 块 新 增加 的 输出 接口 whilo os hio, lo ož] 
EX/MEM 模 块 ， 需 要 给 EX/MEM 模 块 添加 如 表 6-3 所 示 的 接口 。 


表 6-3 EX/MEM 模 块 要 增加 的 接口 





接口 名 fe FA 





ex_whilo 丸 行 阶段 的 指令 是 否 要 写 HI LO 寄存 器 


ex hi 丸 行 阶段 的 指令 要 写 入 HI 寄存 器 的 值 





ex lo 


EX/MEM 模 块 的 代码 修改 如 下 ， 完 整 代码 位 于 本 书 附 带 光盘 中 
Code\Chapter6 目 录 下 的 ex_mem.v 文 件 。 主 要 修改 的 部 分 使 用 加 粗 、 斜 
体 表 示 ， 作 用 是 将 执行 阶段 得 到 的 对 HI、LO 寄 存 器 的 写 信息 传递 到 访 
存 阶段 。 






































module ex_mem( 


input wire clk, 


input wire rst, 


// 来 自 执 行 阶段 的 信息 


input wire[ RegAddrBus | ex_wd, 

















6.3.4 ”修改 访 仓 阶段 


1. 修改 MEM 人 模块 


参考 图 6-5，EX/MEM 模 块 新 增加 的 输出 接口 mem_whilo、 
mem_hi、mem_lo 连 接 到 访 存 阶段 的 MEM 模 块 ， 需 要 给 MEM 模 块 添加 
如 表 6-4 所 示 的 接口 。 


表 6-4 MEM 模 块 要 增加 的 接口 


用 


、 | 沪 存 阶段 的 指令 是 否 要 写 HH、LO 寄存 器 





人 旬 段 的 指令 要 写 入 HI 寄存 器 的 值 

段 的 指令 要 写 入 LO 寄存 器 的 值 

段 的 指令 最 终 是 否 要 写 HL LO 寄存 器 
段 的 指令 最 终 要 写 入 HI 寄存 器 的 值 

段 的 指令 最 终 要 写 入 LO 寄存 器 的 值 


























MEM 模 块 的 代码 修改 如 下 。 对 应 本 书 附带 光盘 中 Code\Chapter6 目 
录 下 的 mem.v 文 件 。 主 要 修改 的 部 分 使 用 加 粗 、 和 斜体 表示 ， 作 用 是 将 对 
HI、LO 寄 存 器 的 写 信 息 传 递 到 MEM/WB 模 块 ， 后 者 会 将 这 些 信息 传递 
到 回 写 阶段 。 

















修改 MEM/WB 模 块 


参考 图 6-5，MEM 模 块 新 增 的 输出 接口 whilo o, hi o、lo_o 连 接 到 
MEM/WB 模 块 ， 需 要 给 MEM/WB 模 块 添加 如 表 6-5 所 示 的 接口 。 


表 6-5 MEM/WB 模 块 要 增加 的 接口 





EHESTEN TT TT sm | 

PE fm Iwan 

3 e 15 fen Tu 
1 


mem lo 





wb_whilo DN 引 阶段 的 指令 是 否 要 写 HI, LO 寄存 器 





wb_hi E 合 山 可 写 阶段 的 指令 要 写 入 HI 寄存 器 的 值 






































wb lo meh 阶段 的 要 写 入 LO 寄存 器 的 值 


MEM/WB 模 块 的 代码 修改 如 下 。 对 应 本 书 附带 光 税 中 
Code\Chapter6 目 录 下 的 mem_wb.v 文 件 。 主 要 修改 的 部 分 使 用 加 粗 、 斜 
体 表 示 ， 作 用 是 将 对 HI、LO 寄 存 器 的 写 信息 传递 到 回 写 阶段 。 


module mem_wb ( 


input wire clk, 


input wire rst, 


// 访 存 阶段 的 结果 
input wire[ RegAddrBus] mem_wd, 
input wire mem_wreg, 


input wire[ RegBus] mem_wdata, 














end 


end 


endmodule 


6.3.5 ”修改 回 写 阶段 


参考 图 6-5，MEM/WB 模 块 输出 的 对 HI、LO 寄 存 器 的 写 信 息 将 直接 
送 到 HILO 模 块 ， 包 括 : wb_whilo、wb_hi、wb lo， 后 者 据 此 修改 HI、 
LO 寄存 器 的 值 。 











6.3.6 ”修改 OpenMIPS 顶 层 模块 


由 于 本 章 增 添 了 HILO 模 块 ， 而 且 对 流水 线 中 的 多 个 模块 都 增加 了 
接口 ， 所 以 需要 修改 OpenMIPS 顶 层 模块 ， 在 其 中 将 各 个 模块 新 增加 的 
接口 按照 如 图 6-5 所 示 的 关系 连接 起 来 。 因 为 很 好 理解 ， 所 以 具体 代码 
不 在 书 中 罗列 ， 读 者 可 以 参考 本 书 附带 光盘 中 Code\Chapter6 目 录 下 的 
openmips.v 文 件 。 


6.4 测试 程序 


本 节 将 通过 一 个 测试 程序 验证 为 OpenMIPS 处 理 器 添加 的 移动 操作 
指令 是 否 实现 正确 ， 测 试 程序 如 下 ， 对 应 本 书 附带 光盘 中 
Code\Chapter6\AsmTest 目 录 下 的 inst_rom.S 文 件 。 





// 对 于 movz 指 令 而 言 ， 由 于 寄存 器 $3 不 为 0， 所 以 不 赋值 ，$4 的 值 保持 不 变 
movz $4,$2,$3 # $4 = 0x05050000 


// 连续 三 条 mthi 指 令 ， 分 别 将 寄存 器 $0、$2、$3 的 值 保 存 到 HI 寄存 器 


mthi $0 # hi = 0x00000000 
mthi $2 # hi = Oxffff0000 
mthi $3 # hi = 0x05050000 


// 读 取 HI 寄 存 器 的 值 到 $4， 同 时 可 验证 HI、L0 寄 存 器 带 来 的 数据 相关 问题 是 否 处 下 
mfhi $4 # $4 = 0x05050000 


// 连续 三 条 指令 mt10， 分 别 将 寄存 器 $3、$2、$1 的 值 保存 到 LO 寄存 器 


mtlo $3 # lo = 0x05050000 
mtlo $2 # lo = OXffff0000 
mtlo $1 # lo = 0x00000000 


// 读 取 LO 寄存 器 的 值 到 $4， 同 时 可 验证 HTI、L0 寄 存 器 带 来 的 数据 相关 问题 是 否 处 和 
mflo $4 # $4 = 0x00000000 


程序 的 注释 给 出 了 预期 效果 ， 将 上 述 inst_rom.S 文 件 与 第 4 章 建 立 的 
Bin2Mem.exe, Makefile, a= ee 到 Ubuntu 虚拟 机 中 的 同 
一 个 目录 下 ， 打 开 终 端 ， 使 用 cd 命令 进入 该 目录 ， 然 后 输入 make al, 
即 可 得 到 用 于 ModelSim 仿 真 的 指令 存储 器 初始 化 文件 inst_rom.data。 


在 ModelSim 中 新 建 一 个 工程 ， 添 加 本 书 附带 光盘 中 Code\Chapter6 
目录 下 的 所 有 .v 文 件 ， 然 后 可 以 编译 。 再 将 上 面 的 inst_rom.data 文 件 复 
制 到 ModelSim 工 程 的 目录 下 ， 就 可 以 进行 仿真 了 。 





ModelSim 仿 真 输出 结果 如 图 6-7、 图 6-8 所 示 ， 观 察 $4、HI、LO 寄 
存 器 值 的 变化 可 以 知道 OpenMIPS 正 确实 现 了 移动 操作 指令 。 


® rst sto 

de dk Sti 
B® regflei/regs[1] 00... 
54 regfilet/regs[2] | fff... 
104 reafilei/regs[3] |05... 
1-4 reafilet/regs[4] |05... 
4 hilo_regofhi_o Jos... 
4 hilo_regdflo_o Jon... 


$4 寄存 器 的 值 从 0x0 变 为 0xffff0000， 并 保持 两 个 时 钟 
司 期 ， 然 后 变 为 0x05050000 


图 6-7 移动 操作 指令 仿真 测试 结果 1 


























© HILO 模 块 的 输出 hi_o， 即 HI 寄存 器 的 值 ， 从 0x0 变 
化 为 0xffff0000， 最 终 变 化 为 0x05050000 





S 


® rst sto 

® ck Sti 
+4 regfileifregs[1] [00... 
1-4 regfilet/regs[2] fFF... 
4 reafilet/regs[3] (05... 
EÈ reafilet/regs[4]  [00... 
4 hilo_reg0/hio |05... 
4 hilo_reg0/lo_o 00... 


@ HILO 模 块 的 输出 lo o， 即 LO 寄存 器 的 值 ， 从 O 人 4 寄存 器 最 后 的 值 与 LO | 
0x05050000 变 化 为 0xfffft0000， 最 终 变 化 为 0x0 寄存 器 一 样 ， 也 为 0x0 a 


图 6-8 移动 操作 指令 仿真 测试 结果 2 
































第 7 草 BARRE SCH SH 


本 章 将 实现 MIPS32 指 令 集 架构 定义 的 所 有 算术 操作 指令 ， 共 有 21 
和 条， 按照 OpenMIPS 实 现 这 些 指令 的 方式 ， 可 以 分 为 三 类 ， 分 别 介绍 如 
下 。 


C1) 简单 算术 操作 指令 


共有 15 条 ， 包 括 加 法 、 减 法 、 比 较 、 乘 法 等 指令 ， 这 些 指令 在 流水 
线 的 执行 阶段 都 只 需要 一 个 时 钟 周 期 ， 而 且 实现 思路 很 和 直观， 与 第 4 章 
应 加 逻辑 操作 指令 类 似 ， 只 需 修改 译 码 阶段 的 症 模 其、 执行 阶段 的 EX 
模块 ， 即 可 实现 。 


(2) REM, He zs walt > 


共有 4 条 : KARIM (madd) . et SHEA Cmaddu) . RRI 

(msub) 、 无 符号 乘 累 减 (msubu) 。 其 中 madd、maddu 要 求 操作 数 相 
乘 后 ， 再 与 HI、LO 寄 存 器 的 值 相 加 ，msub、msubu 指 令 要 求 操作 数 相 
乘 后 ， 再 与 H、LO 寄 存 器 的 值 相 减 。 也 就 是 说 ， 这 4 条 指令 都 要 做 两 次 
运算 ， 一 次 乘法 、 一 次 加 〈 减 ) 法 ， 如 果 将 这 两 次 运算 放 在 流水 线 执 行 
阶段 的 一 个 时 钟 周 期 中 完成 ， 那 么 会 使 流水 线 执行 阶段 所 需要 的 时 间 明 
显 增 加 ， 从 而 降低 OpenMIPS 工 作 时 钟 的 频率 ， 因 此 ，OpenMIPS 设 计 在 
流水 线 执行 阶段 使 用 两 个 时 钟 周 期 完成 这 类 指令 ， 一 个 时 钟 周期 进行 乘 
法 ， 下 一 个 时 钟 周期 进行 加 ( 减 ) 法 。 


(3) 除法 指令 


共有 2 条 : 有 符号 除法 (div) 、 无 符号 除法 (divu) 。OpenMIPS 计 


划 采 用 试 商法 完成 除法 运算 ， 对 于 32 位 的 除法 ， 流 水 线 执行 阶段 至 少 需 
要 32 个 时 钟 周期 。 也 就 是 说 ， 除 法 指令 需要 多 个 时 钟 周 期 才能 完成 ， 所 
以 单独 作为 一 类 。 


本 章 将 分 别 介绍 上 述 三 种 类 别 的 算术 操作 指令 的 实现 过 程 。7.1 市 
一 7.4 节 给 出 了 简单 算术 操作 指令 的 格式 和 作用 ， 介 绍 了 实现 思路 ， 并 
修改 OpenMIPS 代 码 以 实现 简单 算术 操作 指令 ， 最 后 通过 ModelSim 仿 真 
验证 是 人 否 实现 正确 。 

因为 乘 累 加 、 乘 累 减 、 除 法 指令 都 需要 在 流水 线 执行 阶段 占用 多 个 
时 钟 周 期 ， 这 就 需要 使 流水 线 暂停 ， 所 以 在 实现 这 些 指令 之 前 ， 先 要 实 
现 流水 线 暂 停 ， 在 7.5 节 介绍 了 使 流水 线 暂 停 的 方法 。 


7.6 广 一 7.9 节 给 出 了 乘 累 加 、 乘 系 减 指令 的 格式 和 作用 ， 介 绍 了 实 
现 思路 ， 并 修改 OpenMIPS 代 码 以 实现 乘 累加 、 乘 累 减 指令 ， 最 后 进行 
仿真 测试 。 


7.10 节 一 7.13 节 给 出 了 除法 指令 的 格式 和 作用 ， 介 绍 了 实现 思路 ， 
并 修改 OpenMIPS 代 码 以 实现 除法 指令 ， 最 后 进行 仿真 测试 。 


7.14 广 给 出 了 实现 算术 操作 指令 后 的 数据 法 图 。 


7.1 简单 算术 操作 指令 说 明 


简单 算术 操作 指令 一 共有 15 条 ， 有 具体 包括 : add, addi. addiu, 
addu、sub、subu、clo、clz、slt、slti、sltiu、sltu、mul、mult、multu， 


各 指令 的 格式 及 作用 说 明 如 下 。 
1. add、addu、sub、subu、slt、sltu 指 令 


这 6 条 指令 的 格式 如 图 7-1 所 示 ， 从 图 中 可 以 发 现 这 6 条 指令 都 是 R 类 
型 指令 ， 并 且 指 令 码 都 是 6b000000， 即 SPECIAL 类 。 另 外 ， 第 6 一 10bit 
都 为 0， 需 要 依据 指令 中 第 0 一 5bit 功 能 码 的 值 进一步 判断 是 哪 一 种 指 


令 。 
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图 7-1 add, addu, sub, subu, sit, situ Rx 


e 当 功 能 码 是 6b100000 时 ， 表 示 add 指 令 ， 加 法 运算 。 


指令 用 法 为 : add rd, rs, rto 


SEHN: rd <- rs + rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 rt 
的 通用 寄存 器 的 值 进行 加 法 运算 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄存 器 
中 。 但 是 有 一 种 特殊 情况 : 如 有 果 加 法 运算 溢出 ， 那 么 会 产生 溢出 异常 ， 
同时 不 保存 结果 。 


e 当 功 能 码 是 6b100001 时 ， 表 示 addu 指 令 ， 加 法 运算 。 
指令 用 法 为 : addu rd, rs, rt。 


SHN: rd <- rs + rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 rt 
的 通用 寄存 器 的 值 进行 加 法 运算 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄存 器 
中 。 与 add 指 令 的 不 同 之 处 在 于 addu 指 令 不 进行 溢出 检查 ， 总 是 将 结果 
保存 到 目的 寄存 器 。 





e 当 功 能 码 是 6b100010 时 ， 表 示 sub 指 令 ， 减 法 运算 。 
FAHNEN: sub rd, rs, rto 
指令 作用 为 : rd <- rs - rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 rt 
的 通用 寄存 器 的 值 进行 减法 运算 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄存 器 


中 。 但 是 有 一 种 特殊 情况 : 如 果 减 法 运算 洲 出 ， 那 么 产生 洲 出 异常 ， 同 
时 不 保存 结果 。 





e 当 功 能 码 是 6b100011 时 ， 表 示 subu 指 令 ， 减 法 运算 。 
EHEN: subu rd, rs, rt. 


指令 作用 为 : rd <- rs - rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 rt 


的 通用 寄存 器 的 值 进 行 减法 运算 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄存 器 
中 。 与 sub 指 令 的 不 同 之 处 在 于 : subu 指 令 不 进行 溢出 检查 ， 总 是 将 结 
果 保 存 到 目的 寄存 器 。 


e 当 功 能 码 是 6b101010 时 ， 表 示 slt 指 令 ， 比 较 运 算 。 
指令 用 法 为 : slt rd, rs, rt。 


站 令 作 用 为 : rd <- (rs < rt)， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 
rt 的 通用 寄存 器 的 值 按照 有 符号 数 进行 比较 ， 如 果 前 者 小 于 后 者 ， 那 么 
将 1 保存 到 地 址 为 rd 的 通用 寄存 器 中 ; 反之 ， 将 0 保存 到 地 址 为 rd 的 通用 
ar Fas o 





e 当 功 能 码 是 6b101011 时 ， 表 示 sltu 指 令 ， 比 较 运 算 。 
间 令 用 法 为 : sltu rd, rs, rt. 


指令 作用 为 : rd <- (rs < rt)， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 
rt 的 通用 寄存 器 的 值 按 照 无 符号 数 进行 比较 ， 如 果 前 者 小 于 后 者 ， 那 么 
将 1 保存 到 地 址 为 rd 的 通用 寄存 器 中 ; 反之 ， 将 0 保存 到 地 址 为 rd 的 通用 
寄存 器 中 。 





2. addi、addiu、slti、sltiu 指 令 


这 4 条 指令 的 格式 如 图 7-2 所 示 ， 从 图 中 可 以 友 现 这 4 条 指令 部 是 I 类 
型 指令 ， 能 够 依据 指令 中 第 26 一 31bit 指 令 码 的 值 判 断 是 哪 一 种 指令 。 
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图 7-2 addi、addiu、slti、sltiu 指 令 格式 
e 当 指 令 码 是 6b001000 时 ， 表 示 addi 指 令 ， 加 法 运算 。 
ES FAVA: addi rt, rs, immediate. 


站 令 作用 为 :rt <- rs + (sign_extended)immediate， 将 指令 中 的 16 位 
立即 数 进 行 符号 扩展 ， 与 地 址 为 rs 的 通用 寄存 器 的 值 进行 加 法 运算 ， 结 
果 保 存 到 地 址 为 rt 的 通用 寄存 器 中 。 但 是 有 一 个 特殊 情况 : 如 果 加 法 运 
算 淤 出， 那么 产生 淤 出 异常 ， 同 时 不 保存 结 





e 当 指 令 码 是 6b001001 时 ， 表 示 addiu 指 令 ， 加 法 运算 。 
指令 用 法 为 : addiu rt, rs, immediate. 
指令 作用 为 : rt <- rs + (sign_extended)immediate， 将 指令 中 的 16 位 
芯 即 数 进行 符号 扩展 ， 与 地 址 为 rs 的 通用 寄存 器 的 值 进 行 加 法 运算 ， 结 
果 保 存 到 地 址 为 rt 的 通用 寄存 器 中 。 与 addi 指 令 的 区 别 在 于 : addiu 指 令 
不 进行 溢出 检查 ， 总 是 将 结果 保存 到 目的 寄存 器 。 





。 当 指 令 码 是 6b001010 时 ， 表 示 slti 指 令 ， 比 较 运 算 。 


指令 用 法 为 : slti rt, rs, immediate. 


指令 作用 为 :rt <- (rs < (sign_extended)immediate)， 将 指令 中 的 16 位 
立即 数 进 行 符号 扩展 ， 与 地 址 为 rs 的 通用 寄存 器 的 值 按照 有 符号 数 进行 
比较 ， 如 果 前 者 大 于 后 者 ， 那 么 将 1 保存 到 地 址 为 rt 的 通用 宫 存 器 中 ; R 
之 ， 将 0 保存 到 地 址 为 rt 的 通用 寄存 器 中 。 


e 当 指 令 码 是 6b001011 时 ， 表 示 sltiu 指 令 ， 比 较 运 算 。 
指令 用 法 为 : sltiu rt, rs, immediate. 
站 令 作用 为 : rt<- (rs < (sign_extended)immediate)， 将 指令 中 的 16 位 
立即 数 进 行 符号 扩展 ， 与 地 址 为 rs 的 通用 寄存 器 的 值 按照 无 符号 数 进行 


比较 ， 如 果 前 者 大 于 后 者 ， 那 么 将 1 保存 到 地 址 为 rt 的 通用 寄存 器 中 ; 反 
之 ， 将 0 保存 到 地 址 为 rt 的 通用 寄存 器 中 。 


3. clo、clz 指 今 


这 2 条 指令 的 格式 如 图 7-3 所 示 ， 从 图 中 可 以 发 现 这 2 条 指令 都 是 R 类 
型 指令 ， 并 且 指 令 码 都 是 6b011100， 在 MIPS32 指 令 集 架构 中 表示 
SPECIAL2 类 。 另 外 ， 第 6 一 10bit 都 为 0， 需 要 依据 指令 中 第 0 一 5bit 功 能 
码 的 值 进一步 判断 是 哪 一 种 指令 。 
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图 7-3 clo, ciz% AKA 


。 当 功 能 码 是 6b100000 时 ， 表 示 clz 指 令 ， 计 数 运算 。 


间 令 用 法 为 : clz rd, rs. 


指令 作用 为 : rd <- coun_leading_zeros rs， 对 地 址 为 rs 的 通用 寄存 器 
的 值 ， 从 其 最 高 位 开始 加 最 低位 方 回 检 查 ， 直 到 过 到 值 为 “1” 的 位 ， 将 
该 位 之 前 “0” 的 个 数 保存 到 地 址 为 rd 的 通用 寄存 器 中 ， 如 果 地 址 为 rs 的 通 
用 寄存 器 的 所 有 位 都 为 0 〈 即 0x00000000) ， 那 么 将 32 保 存 到 地 址 为 rd 
的 通用 寄存 器 中 。 





。 当 功 能 码 是 6b100001 时 ， 表 示 clo 指 令 ， 计 数 运算 。 
FAHNEN: dord, rs: 


指令 作用 为 : rd <- coun_leading_ones rs， 对 地 址 为 rs 的 通用 寄存 器 
的 值 ， 从 其 最 高 位 开始 同 最 低位 方向 检查 ， 直 到 遇 到 值 为 “0 的 位 ， 将 
该 位 之 前 “1 的 个 数 保存 到 地 址 为 rd 的 通用 寄存 器 中 ， 如 果 地 址 为 rs 的 通 
用 寄存 器 的 所 有 位 都 为 1 ( 即 0xFFFFFFFF) ， 那 么 将 32 保 存 到 地 址 为 rd 
的 通用 寄存 器 中 。 





4. multu, mult. mulf§4 


这 3 条 指令 的 格式 如 图 7-4 所 示 ， 可 知 这 3 条 指令 都 是 R 类 型 指令 ， 并 
且 mul 指 令 的 指令 码 是 SPECIAL2，mult 和 multu 的 指令 人 码 是 SPECIAL。 
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图 7-4 mul、mult、mutlu 指 令 格 式 
e 当 指 令 码 为 SPECIAL2， 功 能 码 为 6b000010 时 ， 表 示 mul 指 
令 ， 乘 法 运算 。 
站 令 用 法 为 : mul rd, rs, Sto 
指令 作用 为 : rd <- rs x rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 rt 


的 通用 寄存 器 的 值 作为 有 符 写 数 相 乘 ， 乘 法 结果 的 低 32bit 保 存 到 地 址 为 
rd 的 通用 寄存 器 中 。 


e 当 指 令 码 为 SPECIAL， 功 能 码 为 6b011000 时 ， 表 示 mult 指 令 ， 
乘法 运算 。 
指令 用 法 为 : mult rs, st。 
SHX: (hi, lo} <- rs x rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 


址 为 rt 的 通用 寄存 器 的 值 作 为 有 符号 数 相 乘 ， 乘 法 结果 的 低 32bit 保 存 到 
LO 寄存 器 中 ， 高 32bit 保 存 到 HI 寄存 器 中 。 


e 当 指 令 码 为 SPECIAL， 功 能 码 为 6b011001 时 ， 表 示 multu 指 
令 ， 乘 法 运算 。 
指令 用 法 为 : multu rs, sto 
日 令 作 用 为 : {hi, lo} <- rs x rt， 将 地 址 为 rs 的 通用 寄存 右 的 值 与 地 
址 为 rt 的 通用 寄存 器 的 值 作 为 无 符号 数 相 乘 ， 乘 法 结果 的 低 32bit 保 存 到 


LO 寄存 器 中 ， 高 32bit 保 存 到 HI 寄存 器 中 。 与 mult 指 令 的 区 别 在 于 : 
multu 指 令 执 行 中 将 操作 数 作为 无 符号 数 进行 运算 。 


7.2 简单 算术 操作 指令 实现 思路 


虽然 简单 算术 操作 指令 的 数目 比较 多 ， 有 15 条 ， 但 实现 方式 都 是 相 
似 的 ， 与 前 几 章 逻 辑 、 移 位 操作 指令 的 实现 方式 也 很 类 似 ， 不 需要 增加 
新 的 模块 和 新 的 接口 ， 只 需要 修改 流水 线 译 码 阶段 的 ID 模块 、 执 行 阶段 
的 EX 模块 即 可 。 实 现 思路 如 下 。 











DM 修改 流水 线 译 人 码 阶 段 的 有 D 模 块 ， 添 加 对 上 述 简单 算术 操作 指 
令 的 译 码 ， 给 出 运算 类 型 alusel o、 运 算 子 类 型 aluop o、 要 写 入 的 目的 
寄存 器 地 址 wd_o 等 信息 ; 同时 根据 需要 ， 读 取 地 址 为 rs、rt 的 通用 寄存 
as HI {EL o 








(2) 修改 流水 线 执行 阶段 的 EX 模块 ， 依 据 传 入 的 信息 进行 运算 ， 
得 到 运算 结果 ， 确 定 最 终 要 写 入 目的 寄存 器 的 信息 〈 包 含 : 是 否 写 、 写 
入 的 目的 寄存 器 地 址 、 写 入 的 值 ) ， 并 将 这 些 信息 传递 到 访 存 阶段 。 





(3) 上 述 信息 会 一 直 传 弟 到 回 写 阶段 ， 最 后 修改 目的 寄存 器 。 


73 ”修改 OpenMIPS 以 实现 简单 算 
术 操 作 指 令 


7.3.1 修改 译 码 阶段 的 ID 模块 


在 译 码 阶段 要 增加 对 简单 算术 操作 指令 的 分 析 ， 分 析 的 前 提 是 能 判 
断 出 指令 的 种 类 ， 根 据 图 7-1 至 图 7-4 可 以 给 出 如 图 7-5 所 示 的 确定 指令 种 


类 的 过 程 。 































































































































































































— EXE_SPECIAL_INST S -EXE_ADD 
op > op2 > op3 > add 指 今 
=EXE_ADDU 
= addu 指 令 
=EXE ADDI =EXE_SUB 
一 一 一 一 一 一 > addi 指 令 一 一 一 一 一 > sub 指 令 
— EXE_ADDIU = EXE_SUBU 
| 一 一 一 | addiu 指 令 El > subu 指 令 
=EXE_SLTI = EXE_SLT 
= slti 指 令 | |... 一 一 一 一 一 > sieh > 
=EXE_SLTIU =EXE_SLTU 
一 一 一 一 一 一 > sltiu 指 令 一 一 一 一 一 > sltu 指 令 
= EXE_MULT 
一 一 一 一 一 > mult 指 令 
=EXE MULTU 
一 一 一 一 一 > multu 指 邻 
> roo... 
=EXE_SPECIAL2_INST - EXE_CLZ 
> op3 一 一 > clz 指 令 
=EXE CLO = 
wire[5:0] op = inst_i[31:26]; 一 一 一 > clo 指 令 
wire[4:0] op2 = inst_i[10:6]; EXE_MUL mul 指 令 
wire[5:0] op3 = inst_i[5:0]; 











wire[4:0] op4 = inst_i[20:16]; 
图 7-5 确定 简单 算术 操作 指令 的 过 程 


其 中 涉及 的 宏 定义 如 下 ， 正 是 图 7-5 中 各 个 指令 的 指令 人 码 或 功能 
码 。 在 本 书 附带 光盘 中 Code\Chapter7_1 目 录 下 的 defines.v 文 件 中 可 以 找 


修改 ID 模块 的 代码 如 下 ， 完 整 代码 位 于 本 书 附带 光盘 中 
Code\Chapter7_1 目 录 下 的 id.v 文 件 。 








































































































add $3,$2,$1 


sub $3, $1, $3 
subu $3,$3,$2 


addi $3,$3,2 
ori $3,$0,0x0000 
addiu $3,$3,0x8000 


HHHHHAHHHHAHH 第 三 


or $1, $0, Oxf FFF 
511° Sl 54, 16 
slt $2,$1,$0 
sltu $2,$1, $0 
slti $2,$1,0x8000 
sltiu $2,$1,0x8000 


HAHAHAHA 


lui $1,0x0000 


clo $2,$1 


clz $2,$1 


lui $1,0xffff 
ori $1,$1,0xffff 


# $3 
# $3 
# $3 


# $1 = 
# $1 = 
# $2 = 
# $2 = 
# $2 = 
# $2 = 


第 三 段 : 


# $1 = 


# $2 = 


# $2 = 


# $1 = 
# $1 = 


# $2 加 $1， 有 
# $3 保 持 为 0X 


# $3 = 0x80 
# $3 = OXF 


= 0x11 
= 0x0000000 
= 0Oxffff800 


Ox0000T FFF 
Oxf ff FOO00 
al 











符号 加 法 ， 结 果 游 出， 所 以 $3 
00000000 


000010 $1 减 去 $3， 有 符号 
$3 减 去 $2， 无 符号 





$3 加 2， 有 符号 加 法 
0 
O $3 加 0xffff8000， 无 符 ; 


: Miislt, sltu, slti, sltiufS4 HHHHHHHH 


给 $1 赋 初 什 
比较 $1 与 90x09， 有 符号 比较 
比较 $1 与 9x9， 无 符号 比较 


0 
1 比较 $1 与 Oxffff8000， 有 符号 | 
1 比较 $1 与 Oxffff8000， 无 符号 | 


测试 clo 和 clz 指 令 HHHHHHHH 
0x00000000 ”给 $1 赋 初 值 

0x00000000 ”统计 $1 中 0 之 前 的 1” 的- 
0x00000020 ”统计 $1 中 4 和 41” 之 前 的 “6” 的 - 
Oxffff0000 

Oxffffffff ASIKE 





000... | 100000001 00000000 J0000000 
Te A eee 


fb | jaioooooo Itoooooo 站 
000... | 100000000 10000000 00000003 100000000 | 
| 





O mul 指 令 的 结果 


2 HILO 模 块 的 输出 hi_o， 即 HI 寄存 器 的 值 
© HILO 模 块 的 输出 lo o， 即 LO 寄存 器 的 值 
















































































—> stall 








pc_reg.v 














ao o e ho o ea es 
2 | stalireg from id |ı [ma | 处 于 译 码 阶段 的 指令 是 否 请 求 流水 线 暂 售 

处 于 执行 阶段 的 指令 是 否 请 求 流水 线 暂 售 
Tan CE Tan Tamara 
















































































ACE 








cnt_o ent i  ent_o 
hilo_temp_o hilo 1 hilo o 


cnt 1 
hilo_temp_i 





TEXE MADDI maddu 指 令 
ire[5:0] op = inst_i[31:26]; 
ire[4:0] op2 = inst_i[10:6]; 
ire[5:0] op3 = inst_i[5:0]; NS 


ire[4:0] op4 = inst if20:16]; 




















| 作 用 
eas CT 
Er ESTO ES E IT 


a CA Se 
































a a u 
ER Ce CO ERA 


o ano [es [on [was | 
输出 当前 处 于 执行 阶段 的 第 儿 个 时 钟 周期 

















U () O () O 0 
SPECIAL DIV 
SPECIAL DIVU 











| 置 m 为 被 除数 、n 为 除数 ，k 为 m 的 位 数 ，s 为 商 ， 将 s 清 零 








| 被 减 数 minuend 为 m[k]， 减 数 为 n 



































minuend= (minuend, m[k-1]) minuend= (minuend-n, m[k-1]) 

















minuend | mir 


pepe ee e pee f emmo 
| | | Tan [k-1]) =01 

| 第 3 步 | EA I [Ao [1 omo | | oroom<os-0 | s[1]=0 = 

EX | pomo | 最终 得 到 商 为 0110 








div_opdata2_o 
div_opdatal_o 
signed_div_o 


div_result_i 
div_ready_i 


rst 
clk 


result_o 
ready 0 





ns fa CTI 
a 





DivFree 状 态 DivByZero 状 态 


start_i == ‘DivStart and start_i == DivStop 
annul_i == 1'b0 and 
opdata2_i/=*ZeroWord 


Mr 


ul_i == 1'b0 and cnt /= 32 


annul_i == 1'b0 and cnt = 32 








reg[64:0] dividend; 
reg[1:0] state; 
reg[31:0] divisor; 
reg[31:0] temp_op1; 
reg[31:0] temp_op2; 


//dividendi#R32U KF HE RAL. PAR, SEK UIE REE RIN edividend| 
// 保 存 的 驶 是 当前 得 到 的 中 间 结 果 ，dividend[31:Kk+1] 保 存 的 束 是 被 除数 中 还 没有 
// 的 数据 ，dividend 高 32 位 是 每 次 迭代 时 的 被 减 数 ， 所 以 dividend[63 :32] 就 是 医 
// 中 的 minuend，divisor 就 是 图 7-16 中 的 除数 n， 此 处 进行 的 就 是 ninuend -mn 运算 
// 果 保存 在 div_temp 中 

assign div temp = {1'b0,dividend[63:32]} - {1'b0, divisor}; 


always @ (posedge clk) begin 
if (rst == "RstEnable) begin 
state <= ~DivFree; 
ready 0 <= "DivResultNotReady; 
result_o <= { ZeroWord, ZerowWord}; 
end else begin 
case (state) 
] POCO Di VvEreeltay PEETRE 
// 分 三 种 情况 : 
// (1) 开始 除法 运算 ， 但 除数 为 0， 那么 进入 DivByZzero 状 态 
// (2) 开始 除法 运算 ， 且 除数 不 为 0， 那么 进入 Divon 状 态 ， 初 始 化 cnt 为 人 
// 果 是 有 符号 除法 ， 且 被 除数 或 者 除数 为 负 ， 那 么 对 被 除数 或 者 除数 
a 除数 保存 到 divisor 中 ， 将 被 除数 的 最 高 位 保存 到 dividend 的 第 
// 准备 进行 第 一 次 返 代 
































wire[5:0] op = inst_i[31:26]; wire[4:0] op2 = inst_i[10:6]; 
wire[5:0] op3 = inst_i[5:0]; wire[4:0] o inst_i 
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FE Tran Te EOE ei 

DE jan [mn — — | 
Tem la Ten In 
ICONS [CCE [1 [am EEES 
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FE ”转移 指令 的 实现 


本 章 将 为 OpenMIPS 处 理 器 添加 转移 指令 ， 转 移 指令 包括 跳 转 、 分 
文 两 种 ， 区 别 在 于 前 者 是 绝对 转移 ， 后 者 是 相对 转移 ， 但 实现 方法 是 相 
似 的 。 转 移 指令 涉及 延迟 槽 ， 所 以 首先 在 8.1 节 介绍 延迟 槽 的 概念 ， 接 
着 在 8.2 节 对 MIPS32 指 令 集 架构 中 定义 的 所 有 转移 指令 的 格式 、 作 用 、 
用 法 进行 了 说 明 。 在 8.3 节 介绍 OpenMIPS 实 现 转移 指令 的 思路 ， 以 及 对 
数据 流 图 、 系 统 结构 的 修改 。8.4 节 通过 修改 代码 实现 转移 指令 ， 最 后 
通过 两 个 测试 程序 ， 验 证 转移 指令 是 否 实现 正确 。 





8.1 GEIR A 


在 实现 转移 指令 之 前 ， 先 介绍 一 下 延迟 槽 的 概念 。 在 第 5 章 己 经 介 
绍 了 流水 线 中 存在 的 三 种 相关 : 数据 相关 、 结 构 相 关 、 控 制 相关 。 其 中 
控制 相关 是 指 流水 线 中 的 转移 指令 或 者 其 他 需要 改写 PC 的 指令 造成 的 
相关 。 这 些 指令 改写 了 PC 的 值 ， 所 以 导致 后 面 已 经 进入 流水 线 的 几 条 
指令 无 效 ， 比 如 : 如 果 转 移 指令 在 流水 线 的 执行 阶段 进行 转移 条 件 判 
断 ， 在 发 生 转 移 时 ， 会 导致 当前 处 于 取 指 、 译 码 阶 段 的 指令 无 效 ， 需 要 
重新 取 指 。 如 图 8-1 所 示 。 




















指令 jr$3 的 执行 会 使 得 | ates 

程序 跳 转 到 0x220 处 ， 而 ~ jr$3 # 此 时 $3 为 0x220 | 实际 执 | 

此 时 指令 ori $3,$3,0x84b ~| ori $3,$3,0x8 行 顺 序 | ， 5 

于 流水 线 的 译 码 阶段 ， / ori $3,$3,0x9 iodo 
ERA N | jas 
的 取 指 阶段 ， 这 两 条 指 .Ofg 0x220 

令 将 变 得 无 效 ， 不 会 得 PA or $4,890 OAN, are 
到 执行 qa ee à bee 


图 8-1 转移 指令 会 使 得 其 后 面 已 经 进入 流水 线 的 几 条 指令 无 效 


也 就 是 说 ， 在 流水 线 执行 阶段 进行 转移 判断 ， 并 且 转 移 发 生 ， 那 么 
会 有 2 条 无 效 指令 ， 导 致 浪费 了 两 个 时 钟 周 期 。 为 了 减少 损失 ， 规 定 转 
移 指令 后 面 的 指令 位 置 为 “延迟 槽 >”， 延 迟 槽 中 的 指令 被 称 为 “延迟 指 
A” (也 可 称 之 为 “延迟 槽 指令 ”) 。 延 迟 指令 总 是 被 执行 ， 与 转移 发 生 
与 否 没 有 关系 。 引 入 延 人 运 模 后 的 指令 执行 顺序 如 图 8-2 所 示 。OpenMIPS 
处 理 器 就 计划 使 用 延迟 覃 技术 。 




















指令 jr $3 的 执行 会 使 得 jr$3 # 此 时 $3 为 0x220 | 实际 执 | oe...» 

程序 跳 转 到 0x220 处 ， 而 ori $3,$3,0x8 HEIR A 行 顺序 jr $3 

此 时 指令 ori $3,83,0x84 | ori $3,$3,0x9 | N ori $3,$3,0x8 
于 译 码 阶段 ， 并 且 该 指 | | or $4,$9,$0 
令 是 延迟 指 邻 ， 所 以 将 al 2007  - | | seen 

得 到 执行 or $4,$9,r0 PET = 








图 8-2 引入 延迟 楼 以 减少 转移 带 来 的 损失 


但 是 ， 即 使 引入 延迟 槽 ， 在 转移 发 生 时 仍然 会 导致 已 经 进入 取 指 阶 
段 的 指令 无 效 ， 也 就 是 说 ， 仍 浪费 一 个 时 钟 周期 ， 要 解决 这 个 问题 ， 可 
以 在 译 码 阶段 进行 转移 判断 ， 这 样 就 可 以 避免 浪费 时 钟 周 期 。 
OpenMIPS 处 理 器 就 设计 为 在 译 码 阶段 进行 转移 判断 。 


8.2 ”转移 指令 说 明 


MIPS32 指 令 集 架 构 中 定义 的 转移 指令 共有 14 条 ， 可 分 为 如 下 两 


类 。 


。 跳 转 指令 ， 
。 分 支 指令 ， 


bltzal、 bne。 


其 中 ， 跳 转 指令 是 绝对 转移 ， 分 文 指 令 是 相对 转移 。 本 节 分 别 


这 两 类 指令 。 


跳 转 指令 


jr, jalr. j~ jal. 


b, bal, beq, bgez, bgezal, bgtz, blez, blitz, 


跳 转 指令 的 格式 如 图 8-3 所 示 。 























31 26 25 21 20 16 15 11 10 
SPECIAL = 
000000 IS 00000 00000 00000 a 
SPECIAL JALR 
000000 ES 00000 rd 00000 001001 
J . . 
000010 instr_index 
fia 1 instr_index 














图 8-3 ” 跳 转 指令 的 格式 


jalr 指 令 


j 指 令 


jal 指 令 


从 图 8-3 可 知 ，j、jal 指 令 可 以 通过 指令 人 码 进 行 判 断 ，jr、jalr 指 令 的 
还 需要 依据 功能 码 进一步 判断 。 


BAU NSPECIAL, 


e 当 指 令 中 的 指令 码 为 SPECIAL， 功 能 码 为 6b001000 时 ， 表 示 jr 


指令 





日 令 用 法 为 : jrrs。 


指令 作用 为 : pc <- rs， 将 地 址 为 rs 的 通用 寄存 器 的 值 赋 给 寄存 咒 
PC， 作 为 新 的 指令 地 址 。 





。 当 指 令 中 的 指令 码 为 SPECIAL， 功 能 码 为 6b001001 时 ， 表 示 
jalr 指 令 。 
指令 用 法 为 : jalrrs 或 者 jalr rd, rs. 
站 令 作 用 为 : rd <- return_address, pc <- rs， 将 地 址 为 rs 的 通用 寄存 
器 的 值 赋 给 寄存 器 PC， 作 为 新 的 指令 地 址 ， 同 时 将 跳 转 指令 后 面 第 2 条 
和 令 的 地 址 作为 返回 地 址 保存 到 地 址 为 rd 的 通用 寄存 器 ， 如 果 没 有 在 指 
令 中 指明 rd， 那 么 默认 将 返回 地 址 保存 到 寄存 器 $31。 


© 当 指 令 中 的 指令 码 为 6b000010 时 ， 表 示 j 指 令 。 





指令 用 法 为 : j target。 


指令 作用 为 : pc <- (pc+4)[31,28] || target || “00;”， 转 移 到 新 的 指令 地 
址 ， 其 中 新 指令 地 址 的 低 28 位 是 指令 中 的 target《〈 也 就 是 图 8-3 中 的 
instr_index) 左 移 两 位 的 值 ， 新 指令 地 址 的 高 4 位 是 跳 转 指令 后 面 延 迟 覃 
指令 的 地 址 高 4 位 。 


。 当 指 令 中 的 指令 码 为 6b000011 时 ， 表 示 jal 指 令 。 





站 令 用 法 为 : jal target. 


指令 作用 为 : pc <- (pc+4)[31,28] || target || “00:， 转 移 到 新 的 指令 地 
址 ， 新 指令 地 址 与 指令 j 相 同 ， 不 再 解释 。 但 是 ， 指 令 jal 还 要 将 跳 转 指 
令 后 面 第 2 条 指令 的 地 址 作为 返回 地 址 保存 到 寄存 器 $31。 





j、jal、jr、jalr 指 令 在 转移 之 前 都 要 先 执 行 延迟 槽 指令 。 
2. 分 支 指令 


分 文 指令 的 格式 如 图 8-4 所 示 。 



































31 26 25 21 20 16 15 11 10 6 5 0 
on = a offset beq 指 令 
eae 0 00000 00000 offset b 指 令 
200 i ma 00000 offset bgtz 指 令 
er rs 00000 offset blez 指 令 
a = rt offset bne 指 令 
“000001 | | 00000 ofen bier 
T je E offset bltzal 指 令 
oooi | 于 | on offset becz 指 信 
oo | S | toor ofie bgezal 指 信 
"aooo | 00000 | 10001 oft bale 




















图 8-4 ”分支 指令 的 格式 


从 图 8-4 可 知 ， 前 5 条 指令 beq、b、bgtz、blez、bne 可 以 直接 依据 指 


令 中 的 指令 码 进行 判断 ， 确 定 是 哪 一 条 指令 ， 而 后 5 条 指令 bltz、 
bltzal、bgez、bgezal、bal 的 指令 人 码 都 是 REGIMM， 这 是 一 个 宏 定 义 ， 值 
为 6b000001， 需 要 根据 指令 中 16-20bit 的 值 进 一 步 判 断 ， 从 而 确定 是 哪 


一 条 指令 。 


从 图 8-4 还 可 知 ， 所 有 分 文 指 令 的 第 0 一 15bit 存 储 的 都 是 offset， 如 采 
发 生 转 移 ， 那 么 将 offset 左 移 2 位 ， 并 符号 扩展 至 32 位 ， 然 后 与 延迟 槽 指 
令 的 地 址 相 加 ， 加 法 的 结 采 惑 是 转移 目的 地 址 ， 从 该 地 址 取 指 令 。 


转移 目标 地 址 = (signed_extend)( offset || ‘00’ ) + (pc+4) 


。 当 指 令 中 的 指令 码 为 6b000100 时 ， 表 示 beq 指 令 。 





指令 用 法 为 : beq rs, rt, offset. 


站 令 作 用 为 : if rs = rt then branch， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 
地 址 为 rt 的 通用 寄存 器 的 值 进行 比较 ， 如 果 相 等 ， 那 么 发 后 转移 。 


。 当 指 令 中 的 指令 码 为 6b000100， 且 16-25bit 为 0 时 ， 表 示 b 指 


令 。 





指令 用 法 为 : b offset. 


SEHK: 无 条 件 转 移 ， 从 图 8-4 可 知 ，b 指 令 可 以 认为 是 beq 指 
令 的 特殊 情况 ， 当 beq 指 令 的 rs、rt 都 等 于 0 时 ， 即 为 b 指 令 ， 所 以 在 
OpenMIPS 实 现 的 时 候 不 需要 特意 实现 b 指 令 ， 只 需要 实现 beq 指 令 即 
可 。 








e 当 指 令 中 的 指令 码 为 6b000111 时 ， 表 示 bgtz 指 令 。 


间 令 用 法 为 : bgtz rs, offset. 


指令 作用 为 : if rs > 0 then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
大 于 零 ， 那 么 发 生 转 移 。 





。 当 指 令 中 的 指令 码 为 6b000110 时 ， 表 示 blez 指 令 。 
和 令 用 法 为 : blez rs, offset. 


指令 作用 为 : if rs < 0 then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
小 于 等 于 零 ， 那 么 发 生 转 移 。 





。 当 指 令 中 的 指令 码 为 6b000101 时 ， 表 示 bne 指 令 。 
EHEN: bne rs, rt, offset. 


站 令 作用 为 :if rs #rt then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
不 等 于 地 址 为 rt 的 通用 寄存 器 的 值 ， 那 么 发 生 转 移 。 


。 当 指 令 中 的 指令 码 为 REGIMM， 且 第 16 一 20bit 为 5b00000 时 ， 
表示 bltz 指 令 。 





间 令 用 法 为 : bltz rs, offset. 


指令 作用 为 : if rs < 0 then branch， 如 果 地 址 为 rs 的 通用 寄存 右 的 值 
小 于 0， 那 么 发 生 转 移 。 





e 当 指 令 中 的 指令 码 为 REGIMM， 且 第 16 一 20bit 为 5b10000 时 ， 
表示 bltzal 指 令 。 


指令 用 法 为 : bltzal rs, offset. 


EM ERA: if rs < 0then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
小 于 0， 那 么 发 生 转 移 ， 并 且 将 转移 指令 后 面 第 2 条 指令 的 地 址 作为 返回 
地 址 ， 保 存 到 通用 寄存 器 $31。 





e 当 指 令 中 的 指令 码 为 REGIMM， 且 第 16 一 20bit 为 5b00001 时 ， 
表示 bgez 指 令 。 


指令 用 法 为 : bgez rs, offset. 


ERA: if rs > 0 then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
大 于 等 于 0， 那 么 发 生 转 移 。 
。 当 指 令 中 的 指令 码 为 REGIMM， 且 第 16 一 20bit 为 5b10001 时 ， 
表示 bgezal 指 令 。 





站 令 用 法 为 : bgezal rs, offset. 


指令 作用 为 : if rs > 0 then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
大 于 等 于 0， 那 么 发 生 转移 ， 并 且 将 转移 指令 后 面 第 2 条 指令 的 地 址 作为 
返回 地 址 ， 保 存 到 通用 寄存 器 $31。 


e 当 指 令 中 的 指令 码 为 REGIMM， 且 第 21~~25bit 为 0， 第 16~ 
20bit 为 5b10001 时 ， 表 示 bal 指 令 。 





ES HIM: bal offset. 


虽 令 作用 为 : 无 条 件 转移 ， 并 且 将 转移 指令 后 面 第 2 条 指令 的 地 址 
作为 返回 地 址 ， 保 存 到 通用 寄存 器 $31。 从 图 8-4 的 指令 格式 可 知 ，bal 指 
令 是 bgezal 指 令 的 特殊 情况 ， 当 bgezal 指 令 的 rs 为 0 时， 就 是 bal 指 令 ， 所 
以 在 OpenMIPS 实 现时 ， 不 用 特意 考虑 bal 指 令 ， 只 要 实现 bgezal 指 令 即 





可 。 


综 上 ，b、bal 指 令 不 用 单独 实现 ， 需 要 OpenMIPS 实 现 的 分 文 指令 
只 有 8 条 。 所 有 的 分 文 指令 在 转移 到 目标 地 址 前 都 要 移 执 行 延 迟 槽 中 的 


指令 。 


83 ”转移 指令 实现 电路 
8.3.1 实现 H 路 
根据 8.1 节 的 论述 ， 为 了 尽量 减少 转移 指令 带 来 的 损失 ，OpenMIPS 


在 译 码 阶段 进行 转移 条 件 的 判断 ， 如 果 满 足 转移 条 件 ， 那 么 修改 PC 为 
转移 目标 地 址 。 


8.3.2 ”数据 法 图 的 修改 


为 了 实现 转移 指令 ， 修 改 数 据 流 图 如 图 8-5 所 示 。 
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"e 存储 器 
4s 
clk | 
A 取 指 译 码 y 执行 „We, BS 、 


图 8-5 为 实现 转移 指令 而 修改 的 数据 流 图 


从 图 8-5 中 可 知 ， 在 译 码 阶段 多 了 转移 判断 的 步骤 ， 此 外 ，PC 的 取 
值 变 为 三 种 情况 。 


情况 一 : PC 等 于 PC+4。 这 属于 一 般 情 况 ， 每 个 时 钟 周期 PC 加 4， 


指向 下 一 条 指令 。 


情况 二 : PC 保持 不 变 。 当 流水 线 暂 停 的 时 候 ， 就 会 发 生 这 种 情 
况 ， 参 考 第 7 草 中 流水 线 暂 停 的 实现 。 





情况 三 : PC 等 于 转移 判断 的 结果 。 如 果 是 转移 指令 ， 且 满足 转移 
条 件 ， 那 么 会 将 转移 目标 地 址 赋 给 PC。 


8.3.3 系统 结构 的 修改 


为 了 实现 转移 指令 ， 需 要 对 系统 结构 进行 修改 ， 增 加 部 分 模块 的 接 
口 ， 主 要 修改 如 图 8-6 所 示 。 











取 指 | 洋 码 | 执行 
PC | ID ID/EX EX 
branch_target_address_i i is_in_delayslot_o |-—— id_is_in_delayslot ex_is_in_delayslot HBis_in_delayslot_i 
branch_flag_i | link_addr_o | id_link_address ex_link_address 9 link_address_i 
pc_reg.v | 











next_inst_in_delayslot_o | next_inst_in_delayslot_i 














branch_flag_o is_in_delayslot_o 














id_ex.v exv 























图 8-6 为 实现 转移 指令 而 对 系统 结构 所 做 的 修改 


有 以 下 几 点 说 明 。 


(1) 如 果 处 于 译 码 阶段 的 指令 是 转移 指令 ， 并 且 满 足 转移 条 件 ， 
那么 ID 模块 设置 转移 发 生 标 志 branch_flag_o 为 Branch， 同 时 通过 
branch_target_address_o 接 口 给 出 转移 目的 地 址 ， 送 到 PC 模块 ， 后 者 据 
此 修改 取 指 地 址 。 


(2) 如 果 处 于 译 码 阶段 的 指令 是 转移 指令 ， 并 且 满 足 转移 条 件 ， 
那么 ID 模块 还 会 设置 next_inst_in_delayslot_o 为 InDelaySlot， 表 示 下 一 条 
指令 是 延迟 槽 指令 ， 其 中 ImDelaySlot 是 一 个 宏 定 义 。 
next_inst_in_delayslot_o 信 号 会 送 入 ID/EX 模 块 ， 并 在 下 一 个 时 钟 周期 通 
过 IDEX 模 块 的 is_in_delayslot_o 接 口 送 回 到 ID 模块 ，ID 模 块 可 以 据 此 判 
斯 当前 处 于 译 码 阶 段 的 指令 是 否 是 延迟 模 指 令 。 





(3) 如 果 转 移 指 令 需 要 保存 返回 地 址 ， 那 么 ID 模块 还 要 计算 返回 
地 址 ， 并 通过 link_addr_o 接 口 输出 ， 该 值 最 终 会 传递 到 EX 模块 ， 作 为 要 
写 入 目的 寄存 器 的 值 。 


8.4 修改 OpenMIPS 以 实现 转移 指 


4 


8.4.1 修改 取 指 阶段 的 PC 模块 


由 图 8-6 可 知 ，PC 模 块 需要 增加 接口 ， 增 加 的 接口 如 表 8-1 所 示 。 


表 8-1 PC 模块 增加 的 接口 描述 











修改 取 指 阶段 的 PC 模块 如 下 ， 主 要 修改 一 点 : 如 果 branch_flag i 为 
Branch， 那 么 设置 新 的 PC 值 为 branch_target_address ji。 完整 代码 位 于 本 
书 附带 光盘 中 Code\Chapter8 目 录 下 的 pc_reg.v 文 件 中 。 


module pc_reg( 


input wire clk, 


input wire rst, 


// 来 自控 制 模块 的 信息 
input wire[5:0] stall, 


// 来 自 译 码 阶段 ID 模块 的 信息 








8.4.2 ”修改 译 公 阶段 


1. 修改 ID 模 块 


由 图 8-6 可 知 ，ID 模 块 需要 增加 一 些 接 口 ， 增 加 的 接口 描述 如 表 8-2 
所 示 。 


表 8-2 1D 模 块 新 增加 的 接口 描述 


BT ana CC em] 


branch flag o 


EL 
FET 


和 否 发 生 转移 





= 下 一 条 进 
next inst in delayslot_o PP 
IETS A 
AN FARGE 
is in delayslot i 输入 Bu 


在 ID 模块 要 增加 对 转移 指令 的 分 


branch_target_address_o 


| link addro | addr_o 


ERA, ERASE Cw 








op 











wire[5:0] op 
wire[5:0] op3 = 


其 中 涉及 的 宏 定 义 如 下 ， 在 本 书 附带 光盘 中 Code\Chapter8 目 录 下 的 











> 析 ， 根 据 图 8-3、 图 8-4 给 出 的 转移 
程 如 图 8-7 所 








转移 到 


上 的 目标 地 址 


役 的 指令 是 否 位 于 延 


的 返回 地 址 
段 的 指令 是 





站 段 的 指令 是 否 位 于 延 


















































































































































图 8-7 确定 转移 指令 


defines.v 文 件 中 可 以 找到 这 些 定义 。 


“define EXE_J 


6'b000010 





过 程 





























ZN o 
= EXE_SPECIAL_INST en EXE_JR 
> op2 > op3 > jr 指令 
=EXE JALR 
一 一 一 一 一 > jalr 指 令 
=EXE J aa = 其 他 
| 人 ¡ES = 其 他 MU oe ee 
=EXE_JAL = 
jal 指 令 
=EXE_BEQ = 
beqł S ia 
=EXE BGTZ 
bgtz 指 令 
= EXE BLEZ = 
= blez 指 令 
=EXE_BNE 
bne 指 令 
= EXE_REGIMM_INST =EXE BLTZ 
> op4 PUT I bltz 指 令 
=EXE BLTZAL 
一 一 一 一 一 > bltzal 指 令 
= 其 他 =EXE_BGEZ 
- yi eee > 一 > bgez 指 令 
= EXE_BGEZAL 
一 bgezal 指 令 
= inst_i[31:26]; wire[4:0] op2 = inst_i[10:6]; 
inst_1[5:0];  wire[4:0] op4 = inst_i[20:16]; 


修改 译 码 阶 段 的 有 D 模 块 如 下 。 完 整 代 码 请 参考 本 书 附带 光盘 中 
Code\Chapter8 目 录 下 的 id.v 文 件 。 





















































当前 处 于 译 码 阶段 的 指令 是 否 位 于 
id is in delayslot i 
= 
BA 


下 一 条 进入 译 码 阶段 的 指令 是 否 位 


next inst in delayslot 1 


ex is in delayslot = 
> | i j | i i Ñ 


h, 
e 当前 处 于 译 码 阶 段 的 指令 是 否 位 于 
is_in_delayslot_o = 











1 is_in_delayslot_i 1 输入 
EM 
5 ; 处 于 执行 阶段 的 转移 指令 要 保存 的 返 
2 link address i 32 得 入 同 地 址 

















由 于 jal 0x40 指 令 的 延迟 槽 指令 是 除法 指令 ， 所 以 $1 会 在 多 个 时 钟 周期 保持 为 0x3 


. 00000000 


除法 运算 的 结果 


+ 10000000 / 如 0000038 100000005 joo000006 
PER HERE mn 
... [00000000 jo000000 
+ {00000000 __ 100000008 


+ [30000000 100000008 }00000009 }0000000a 
... 00000002 
000... J0000000e 

















由 于 bal s2 指 令 的 延迟 槽 指令 是 除法 指令 ， 所 以 $1 会 在 多 个 时 钟 周期 保持 为 0x3 


sto 
Sti 
000.. 
000.. 
sto 
Sti 
000.. 
000. 


AA LAA LALA ce L 


(00000001 ______}00000002}0000000 


+. 100000000 


除法 运算 的 结果 
oe ee eS E E a E 


0000000: Do000004 i0000002c 00000005 _ 
PR 


» 100000000 10000000 
A J3HA———_—— i a _ Ñ _ _—_———_—_—_—_—_—_—_—___—_— 
. 100000000 ¡0000000 


FE SR 
. [0000000822222 


- | i00000011 j00000012 0000013 ¿bo00014c 00000014 [3 
a nn an nn A u ne a aa men rn et 


mr 
++ JODOOOOU: 





FE ”加 载 存 储 指令 的 实现 


本 章 将 实现 MIPS32 指 令 集 架构 中 定义 的 加 载 存 储 指令 ， 分 两 步 : 
首先 实现 除 1、sc 指 令 外 的 一 般 加 载 存储 指令 ， 其 次 实现 比较 特殊 的 加 
载 存 储 指 令 11、sc。 





读者 可 以 将 本 章 内 容 分 为 五 个 部 分 理解 阅读 : CD 9.1 至 9.3 节 介绍 
了 一 般 加 载 存储 指令 的 实现 ; 2) 为 了 验证 加 载 存 储 指 令 是 否 实 现 正 
确 ， 在 9.4 节 修改 了 我 们 之 前 一 直 用 来 做 测试 的 9OPC， 为 其 添加 了 数据 
RAM; (3) 9.5 节 给 出 了 针对 一 般 加 载 存 储 指令 的 测试 程序 ， 通 过 
ModelSim 仿 真 验证 指令 是 否 实现 正确 ; (4) 9.6 至 9.9 节 介绍 了 特殊 加 
载 存 储 指令 1 、sc 的 实现 ; (3) 9.10 至 9.12 节 探讨 了 由 于 加 载 指令 引起 
的 load 相 关 问 题 ， 给 出 了 OpenMIPS 的 解决 方法 ， 最 后 验证 了 解决 效 
果 。 





9.1 加 载 存储 指令 说 明 
MIPS32 指 令 集 架构 中 定义 的 加 载 存 储 指 令 共 有 14 条 ， 如 下 。 


e 8 条 加 载 指 令 : Ib. lbu, lh, lhu, II, Iw, lwl, lwr- 


© 6 条 存储 指令 : sb, sc. sh, sw, swl, swro 


对 11、sc 指 令 的 说 明 将 放 在 9.6 节 ， 本 节 介 绍 其 余 的 12 条 指令 ， 在 本 
书 中 也 称 为 一 般 加 载 存 储 指令 。 其 中 ， 由 于 lwl、lwr、swl、Swl 这 4 条 指 
令 的 作用 不 太 容 易 理 解 ， 所 以 在 9.1.4、9.1.5 节 专题 介绍 。 


911 加 载 指令 ib、lbu、lh、lhu、lw 
说 明 


加 载 指令 b、lbu、jh、lhu、lw 的 格式 如 图 9-1 所 示 。 














31 26 25 21 20 16 15 5 
| ‘p00 zu rt offset lb 指令 
l mite base rt offset lbu 指 令 
1 on bare rt offset lh 指令 
ar base rt offset lhu 指 令 
toon 1 base rt offset wif 




















29-1 wee 4E 4 1b. Ibu, Ih, Ihu, Iwé94X 


从 图 9-1 可 知 ， 这 5 条 加 载 指令 可 以 根据 指令 中 26-31bit 的 指令 码 加 


以 区 分 ， 另 外 ， 加 载 指令 的 第 0 一 15bit 是 offset、 第 21 一 15bit 是 base， 加 
载 地 址 的 计算 方法 如 下 ， 先 将 16 位 的 offset 符 号 扩展 至 32 位 ， 然 后 与 地 
址 为 base 的 通用 寄存 器 的 值 相 加 ， 即 可 得 到 加 载 地 址 。 


加 载 地 址 = signed_extended(offset) + GPR[base] 


下 面 分 别 介绍 各 个 加 载 指令 的 作用 。 








。 当 指 令 中 的 指令 码 为 6b100000 时 ， 是 jb 指令 ， 字 节 加 载 指令 。 
站 令 用 法 为 : lb rt, offset(base)。 


指令 作用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 读 取 一 个 字 市 ， 然 后 符 
号 扩展 至 32 位 ， 保 存 到 地 址 为 rt 的 通用 寄存 器 中 。 





。 当 指 令 中 的 指令 码 为 6b100100 时 ， 是 lbu 指 令 ， 无 符号 字 节 加 
载 指令 。 


站 令 用 法 为 : lbu rt, offset(base)。 


指令 作用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 读 取 一 个 字 市 ， 然 后 无 
符号 扩展 至 32 位 ， 保 存 到 地 址 为 gt 的 通用 寄存 器 中 。 


。 当 指 令 中 的 指令 码 为 6b100001 时 ， 是 Ih 指 令 ， 半 字 加 载 指令 。 








SHX: Ih rt, offset(base)。 


指令 作用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 读 取 一 个 半 字 ， 然 后 符 
号 扩展 至 32 位 ， 保 存 到 地 址 为 rt 的 通用 寄存 器 中 。 该 指令 有 地 址 对 齐 要 
求 ， 要 求 加 载 地 址 的 最 低位 为 0。 


。 当 指 令 中 的 指令 码 为 6b100101 时 ， 是 lhu 指 令 ， 无 符号 半 字 加 
载 指令 。 





间 令 用 法 为 : lhu rt, offset(base). 


指令 作用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 读 取 一 个 半 字 ， 然 后 无 
符号 扩展 全 32 位 ， 保 存 到 地 址 为 rt 的 通用 寄存 器 中 。 该 指令 有 地 址 对 齐 
要 求 ， 要 求 加 载 地 址 的 最 低位 为 0。 


。 当 指 令 中 的 指令 码 为 6b100011 时 ， 是 lw 指令 ， 字 加 载 指 令 。 








指令 用 法 为 : lw rt, offset(base)。 


SEHK: 从 内 存 中 指定 的 加 载 地 址 处 ， 读 取 一 个 字 ， 保 存 到 地 
址 为 rt 的 通用 寄存 器 中 。 该 指令 有 地 址 对 齐 要 求 ， 要 求 加 载 地 址 的 最 低 
两 位 为 00。 


912 ”存储 指令 sb、sh、sw 说 明 


存储 指令 sb、sh、sw 的 格式 如 图 9-2 所 示 。 


31 26 25 21 20 16 15 0 














SB EA 
101000 base rt offset sb 指令 
SH EA 
101001 base rt offset sh 指令 
SW 已 人 
101011 base rt offset sw 指令 

















图 9-2 存储 指令 的 格式 


从 图 9-2 可 知 ， 这 3 条 存储 指令 可 以 根据 指令 中 26 一 31bit 的 指令 码 加 


以 区 分 ， 另 外 ， 存 储 指 令 的 第 0 一 15bit 是 offset、 第 21 一 15bit 是 base， 存 
储 地 址 的 计算 方法 如 下 ， 先 将 16 位 的 offset 符 号 扩展 至 32 位 ， 然 后 与 地 
址 为 base 的 通用 寄存 器 的 值 相 加 ， 即 可 得 到 存储 地 址 。 


存储 地 址 = signed_extended(offset) + GPR[base] 


下 面 分 别 介绍 各 个 存储 指令 的 作用 。 








。 当 指令 中 的 指令 码 为 6b101000 时 ， 是 sb 指令 ， 字 节 存 储 指令 。 
HS FAIL: sb rt, offset(base). 


EME: Ka An ASE H 2 Fa HY RRA ee BN FP 
指定 地 址 。 


。 当 指 令 中 的 指令 码 为 6b101001 时 ， 是 sh 指令 ， 半 字 存 储 指令 。 








指令 用 法 为 : sh rt, offset(base)。 
虽 令 作用 为 : 将 地 址 为 rt 的 通用 寄存 器 的 最 低 两 个 字 贡 存储 到 内 存 


中 的 指定 地 址 。 该 指令 有 地 址 对 齐 要 求 ， 要 求 计算 出 来 的 存储 地 址 的 最 
低位 为 0。 





。 当 指 令 中 的 指令 码 为 6b101011 时 ， 是 sw 指令 ， 字 存储 指令 。 








指令 用 法 为 : sw rt, offset(base)。 


BETTER: 将 地 址 为 rt 的 通用 寄存 器 的 值 存储 到 内 存 中 的 指定 地 
址 。 该 指令 有 地 址 对 齐 要 求 ， 要 求 计算 出 来 的 存储 地 址 的 最 低 两 位 为 
00. 


9.1.3 ”加 载 和 存储 指令 用 法 示例 


OpenMIPS 处 理 器 是 按照 字 节 寻 址 ， 并 且 是 大 端 模式 ， 在 这 种 模式 
下 ， 数 据 的 高 位 保存 在 存储 器 的 低地 址 中 ， 而 数据 的 低位 保存 在 存储 器 
的 高 地 址 中 。 比 如 : 使 用 指令 sb 在 0x50 处 存储 0x81， 存 储 器 中 实际 存储 
效果 如 图 9-3 所 示 。 


地 址 0x50 0x51 0x52 0x53 


图 9-3 使 用 指令 sb 在 0x50 处 存储 0x81 











使 用 指令 sh 在 0x54 处 存储 0x8281， 存 储 器 中 实际 存储 效果 如 图 9-4 
PAR o 


地 址 0x54 0x55 0x56 0x57 


图 9-4 使 用 指令 sh 在 0x54 处 存储 0x8281 


使 用 指令 sw 在 0x58 处 存储 0x84838281， 存 储 器 中 实际 存储 效果 如 图 
9-5 所 示 。 


地 址 0x58 0x59 Ox5a 0x5b 


图 9-5 使 用 指令 sw 在 0x58 处 存储 0x84838281 


此 时 使 用 加 载 指令 会 有 如 下 效 宋 。 


(1) 使 用 指令 lbu 从 0x58 处 加 载 一 个 字 节 ， 读 出 的 字 节 就 是 0x84， 
经 无 符号 扩展 至 32 位 是 0x00000084。 





(2) 使 用 指令 lb 从 0x58 处 加 载 一 个 字 节 ， 读 出 的 字 节 就 是 0x84， 
经 符号 扩展 至 32 位 是 Oxffffff84。 





(3) 使 用 指令 lhu 从 0x58 处 加 载 一 个 半 字 ， 读 出 的 半 字 就 是 
0x8483， 经 无 符号 扩展 至 32 位 是 0x00008483。 





(4) 使 用 指令 lh 从 0x58 处 加 载 一 个 半 字 ， 读 出 的 半 字 就 是 
0x8483， 经 符号 扩展 至 32 位 是 0xffff8483。 





(5) 使 用 指令 二 从 0x59 处 加 载 一 个 半 字 ， 不 满足 地 址 对 齐 要 求 ， 
SHA 


(6) 使 用 指令 ]hu 从 0x5a 处 加 载 一 个 半 字 ， 读 出 的 半 字 就 是 
0x8281， 经 无 符号 扩展 至 32 位 是 0x00008281。 





(7) 使 用 指令 jh 从 0x5a 处 加 载 一 个 半 字 ， 读 出 的 半 字 就 是 
0x8281， 经 符号 扩展 至 32 位 是 0xffff8281。 





(8) 使 用 指令 Iw 从 0x58 处 加 载 一 个 字 ， 读 出 的 字 就 是 
0x84838281. 


9.1.4 ”加载 指 令 lwl、lwr 说 明 


加 载 指令 lwl、lwr 的 格式 如 图 9-6 所 示 。 


31 26 25 21 20 16 15 0 











E i 已 人 
100010 base rt offset lwl 指 令 
LWR 、 
100110 base rt offset lwr 指 令 

















图 9-6 ”加载 指 令 Iwl1、1wr 的 格式 


。 当 指 令 中 的 指令 码 为 6b100010 时 ， 是 lwl 指 令 ， 非 对 齐 加载 指 
A, MAMA. 





指令 用 法 为 : lwl rt, offset(base). 


虽 令 作用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 加 载 一 个 字 的 _ 最 高 有 
效 部 分 。1wl 指 令 对 加 载 地 址 没有 要 求 ， 从 而 允许 地 址 非 对 齐 加 载 ， 这 
是 与 前 面 介 绍 的 hh、lhu、lw 指 令 的 不 同 之 处 。 在 大 端 模式 、 小 端 模式 
下 ，lwl 指 令 的 效果 不 同 ， 因 为 OpenMIPS 是 大 端 模式 ， 所 以 此 处 只 介绍 
在 大 端 模式 下 lwl 指 令 的 效果 。 假 设计 算出 来 的 加 载 地 址 是 loadaddr， 
loadaddr 的 最 低 两 位 的 值 为 n， 将 loadaddr 最 低 两 位 设 为 0 后 的 值 称 为 
loadaddr align， 如 下 。 


加 载 地 址 loadaddr = signed_extended(offset) + GPR[base] 
n = loadaddr[1:0] 
loadaddr_align = loadaddr — n 


例如 : 假设 计算 出 来 的 加 载 地 址 是 5，lwl 指 令 要 从 地 址 5 加 载 数 
据 ， 那 么 loadaddr 就 等 于 5，n 等 于 1，loadaddr_align 等 于 4。 


lw] 指 令 的 作用 是 从 地 址 为 loadaddr_align 处 加 载 一 个 字 ， 也 就 是 4 个 
字 节 ， 然 后 将 这 个 字 的 最 低 4-n 个 字 节 保存 到 地 址 为 rt 的 通用 寄存 堪 的 高 


位 ， 并 且 保 持 低位 不 变 。 


继续 上 例 ， 此 时 loadaddr_align 为 4， 所 以 从 地 址 4 处 加 载 一 个 字 ， 对 
应 的 是 地 址 为 4、5、6、7 的 字 节 ， 因 为 n 等 于 1， 上 所 以 将 加 载 到 的 字 的 最 
低 3 个 字 节 保存 到 地 址 rt 的 通用 寄存 器 的 高 3 个 字 节 。 如 网 9-7 所 示 。 一 个 
更 加 通用 的 描述 如 图 9-8 所 示 。 





del 0 1 E AAA 





数据 | x0 | xl | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | x10| x11 






































执行 指令 前 的 $1 e f | |h 























执行 完 指令 后 的 $1 | x5 | x6 | x7 | h Iwl $1,5($0) 





图 9-7 1wl 指 令 作 用 举例 


执行 完 Iwl 指 令 后 ， 
目标 寄存 器 的 值 n 





地 址 loadaddr align 对 应 的 字 | I J Ke ele I IE ER ET 0 





不 同 的 n， 执 行 完 
Iwl 指 令 后 的 目标 寄 
存 器 的 值 也 不 同 


J K | L h 


























标 寄 存 器 的 初始 值 e Ke h BEE e h 2 
L f g h 3 



































图 9-8 1w1 指 令 执 行 效果 说 明 


。 当 指 令 中 的 指令 码 为 6b100110 时 ， 是 lwr 指 令 ， 非 对 齐 加 载 指 
e, ATI 





站 令 用 法 为 : lwr rt, offset(base). 


SEHA: 从 内 存 中 指定 的 加 载 地 址 处 ， 加 载 一 个 字 的 最 低 有 效 
部 分 。 还 是 假设 计算 出 来 的 加 载 地 址 是 loadaddr，loadaddr 的 最 低 两 位 的 





值 为 nD， 将 loadaddr 最 低 两 位 设 为 0 后 的 值 称 为 loadaddr_align， 如 下 。 
加 载 地 址 loadaddr = signed_extended(offset) + GPR[base] 
n = loadaddr[1:0] 
loadaddr_align = loadaddr — n 


例如 : 假设 计算 出 来 的 加 载 地 址 是 9，lwr 指 令 要 从 地 址 9 加 载 数 
据 ， 那 么 loadaddr 就 等 于 9，n 等 于 1，loadaddr_align 等 于 8。 


lwr 指 令 的 作用 是 从 地 址 为 loadaddr_align 处 加 载 一 个 字 ， 也 就 是 4 个 
字 节 ， 然 后 将 这 个 字 的 最 高 n+1 个 字 市 保存 到 地 址 为 rt 的 通用 寄存 器 的 低 
位 ， 并 且 保 持 高 位 不 变 。 





继续 上 例 ， 此 时 loadaddr_align 为 8， 所 以 从 地 址 8 处 加 载 一 个 字 ， 对 
应 的 是 地 址 为 8、9、10、11 的 字 节 ， 因 为 n 等 于 1， 所 以 将 加 载 到 的 字 的 
最 高 2 个 字 节 保存 到 地 址 rt 的 通用 寄存 器 的 低 2 个 字 节 。 如 图 9-9 所 示 。 一 
个 更 加 通用 的 描述 如 图 9-10 所 示 。 





ML A AE AAA 







































































数据 | x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 x10 | xll 
| 
执行 指令 前 的 $1 e f | 站 h 
执行 完 指 令 后 的 $1 | e | f | x8 | x9 Iwr $1,9($0) 




















29-9 1wr 指 令 作 用 举例 


执行 完 ]wr 指 令 后， 


目标 寄存 器 的 值 A 
e f g I 0 





— 
N 
E 


地 址 loadaddr align 对 应 的 字 





不 同 的 na， 执行 完 
lwr 指 令 后 的 目标 寄 
存 器 的 值 也 不 同 


e f I J 























目标 寄存 器 的 初始 值 | e Le ah e I yo | as 2 
I | te | ie 3 


























29-10 Iwr 指令 执行 效果 说 明 





lwl 与 lwr 指 令 配合 可 以 实现 从 一 个 非 对 齐 地 址 加 载 一 个 字 ， 而 且 只 
需要 使 用 2 条 指令 ， 提 高 了 效率 。 例 如 : 使 用 一 般 指 令 从 地 址 7 处 加 载 一 
个 字 ， 那 么 可 以 使 用 以 下 代码 实现 ， 共 5 条 指令 。 


lw $1, 4($0) # 取得 地 址 9x4 处 的 字 ， 保 存在 $1 中 

lw $2, 8($0) # 取得 地 址 9x8 处 的 字 ， 保 存在 $2 中 

sll $1, $1, 24 # $1 左 移 24 位 

slr $2, $2, 8 # $2 右 移 8 位 

or $1, $1, $2 # $1 与 $2 进 行 远 辑 “ 或 “运算 ， 得 到 最 终结 果 


而 有 了 1lwl、lwr 指 令 后 ， 只 需要 2 条 指令 即 可 。 如 下 ， 图 9-11 是 对 这 
个 过 程 的 描述 。 


Eh 
Nn 


地 址 0 1 2 3 
数据 | x0 


6 AE 9 10 ~T 





x2 | x3 | x4 | x5 | x6 II x11 


xl 





























执行 指令 前 的 $1 e || ee | Sh 








执行 完 lwl 指 令 后 的 $1 ES | h Iwl $1,7($0) 











执行 完 lwr 指 令 后 的 $1 x? | Xe 39 xl Iwr $1,10($0) 




















图 9-11 组合 使 用 指令 1Iwl、1lwr， 可 以 加 载 非 对 齐 地 址 的 字 


lwl $1, 7($0) 
lwr $1,10($0) 


915 ”存储 指令 swl、swr 说 明 


存储 指令 swl、swr 的 格式 如 图 9-12 所 示 。 


31 26 25 21 20 16 15 0 




















SWL SA 
101010 base rt offset Swl 指 令 
SWR LA 
101110 base rt offset swr 指 令 








图 9-12 ”存储 指令 sw1、swr 的 格式 


。 当 指 令 中 的 指令 码 为 6b101010 时 ， 是 swl 指 令 ， 非 对 齐 存储 指 
令 ， 向 左 存储 。 





指令 用 法 为 : swl rt, offset(base)。 


指令 作用 为 : 将 地 址 为 _rt 的 i as 部 分 _ 存 储 到 内 存 中 

定 的 地 址 处 ， 和 利用 寄存 器 的 哪 几 
Ne. swl 指 令 对 存储 地 址 没有 对 齐 要 求 ， 这 是 与 前 面 介绍 的 sh、sw 
指令 的 不 同 之 处 。 在 大 端 模式 、 小 端 模式 下 ，swl 指 令 的 效果 不 同 ， 
为 OpenMIPS 是 大 端 模式 ， 所 以 此 处 只 介绍 在 大 端 模 式 下 swl 指 令 的 效 
果 。 假 设计 算出 来 的 存储 地 址 是 storeaddr，storeaddr 最 低 两 位 的 值 为 n， 
storeaddr 最 低 两 位 设 为 0 后 的 值 称 为 storeaddr_align， 如 下 。 











存储 地 址 storeaddr = signed_extended(offset) + GPR[base] 


n = storeaddr[1:0] 


storeaddr_align = storeaddr - n 


例如 : 假设 计算 出 来 的 存储 地 址 是 5，swl 指 令 要 向 地 址 5 存储 数 
据 ， 那 么 storeaddr 就 等 于 5，n 等 于 1，storeaddr_align 等 于 4。 


swl 指 令 的 作用 是 将 地 址 为 rt 的 通用 寄存 器 的 最 高 4-n 个 字 节 存储 到 
地 址 storeaddr 处 。 


继续 上 例 ， 此 时 storeaddr_align 为 4，n 为 1， 所 以 将 地 址 rt 的 通用 寄 
存 器 的 最 高 3 个 字 节 存储 到 从 地 址 5 开始 处 ， 对 应 的 是 地 址 为 5、6、7 的 
三 个 字 节 ， 如 图 9-13 所 示 。 一 个 更 加 通用 的 摘 述 如 图 9-14 所 示 。 














通用 寄存 器 $1 的 值 e 














执行 swl 指 令 之 前 的 内 三 


a A AA AE A 





数据 | x0 | xl x2 x3 x4 | x5 x6 x7 | x8 x9 | x10 | xll 















































执行 swl 指 令 之 后 的 内 存 
e o 1 2 3/4 5 6 rle 9 10 11 





数据 | x0 | xl | x2 | x3 x8 | x9 | x10 | x11 






































29-13 sw| 指 令 作 用 举例 


执行 完 swl 指 令 后 ， 内 存 地 
址 storeaddr align 对 应 内 容 N 





Ee 20 1 Jixit z a 0 oe 
. 不 同 的 n， 执 行 完 
I e fi g swl 指 令 后 的 内 存 地 
址 storeaddr_align 处 
存储 的 值 也 不 同 





























N 


地 址 为 rt 的 通用 寄存 器 的 值 TI | J u 


o 
rn 

Wied 
zg 




















JAE e 3 





图 9-14 swi 指令 执行 效果 说 明 


。 当 指 令 中 的 指令 码 为 6b101110 时 ， 是 swr 指 令 ， 非 对 齐 存 储 指 
S, HATI. 





间 令 用 法 为 : swr rt, offset(base)。 


虽 令 作用 为 : 将 地 址 为 _Kt 的 通用 寄存 器 的 低位 部 分 _ 存储 到 内 存 中 
虽 定 的 地 址 处 ， 存 储 地 址 的 最 后 两 位 确定 了 要 存储 rt 通用 寄存 器 的 哪 几 
个 字 节 。 还 是 假设 计算 出 来 的 存储 地 址 是 storeaddr，storeaddr 的 最 低 两 
位 的 值 为 n，storeaddr 最 低 两 位 设 为 0 后 的 值 称 为 storeaddr_align， 如 下 。 





存储 地 址 storeaddr = signed_extended(offset) + GPR[base] 
n = storeaddr[1:0] 


storeaddr_align = storeaddr - n 


例如 : 假设 计算 出 来 的 存储 地 址 是 9，swr 指 令 要 问 地 址 9 存储 数 
据 ， 那 么 storeaddr 就 等 于 9，n 等 于 1，storeaddr_align 等 于 8。 


swr 指 令 的 作用 是 将 地 址 为 rt 的 通用 寄存 器 的 最 低 n+1 个 字 节 存储 到 
地 址 storeaddr_ align 人 处。 


继续 上 例 ， 此 时 storeaddr_align 为 8，n 为 1， 所 以 将 地 址 rt 的 通用 寄 


存 占 的 最 低 2 个 字 忆 存储 到 从 地 址 8 开始 处 ， 对 应 的 是 地 址 为 8、9 的 两 个 
位 置 ， 如 图 9-15 所 示 。 一 个 更 加 通用 的 摘 述 如 图 9-16 所 示 。 





通用 寄存 器 $1 的 值 e 














执行 swr 指 令 之 前 的 内 存 


地 址 0 1 2 3 | 4 5 6 7 8 9 10 11 
数据 | x0 | xl 





x6 | x7 x8 x9 | x10 | xll 















































swr $1,9($0) 











执行 swr 指 令 之 后 的 内 存 
地 址 0 1 2 3 | 4 5 6 7 8 9 10 11 
数据 | x0 | xl 





x4 | x5 | x6 | x7 ww mom x10 | x11 









































29-15 swr 指令 作用 举例 


执行 完 Swr 指 令 后 ， 内 存 地 
址 storeaddr align 对 应 内 容 n 






































内 存 地 址 storeaddr_align 对 I | ages | - > kL 0 
应 的 学 不 同 的 n， 执 行 完 
ee K | L 1 swr 指 令 后 的 内 存 地 
址 storeaddr align 处 
地 址 为 rt 的 通用 寄存 器 的 值 | e@ | 人 | ge | h Pye DL | 2 存储 的 值 也 不 同 
e f g h 3 




















29-16 swr 指令 执行 效果 说 明 


swl 与 swr 指 令 配 合 可 以 实现 同一 个 非 对 齐 地 址 存储 一 个 字 ， 而 且 只 
须 使 用 2 条 指令 ， 提 高 了 效率 。 例 如 : 使 用 一 般 指令 向 地 址 7 处 存储 一 个 
字 ， 那 么 可 以 使 用 以 下 代码 实现 ， 共 5 条 指令 。 





sll $2, $1, 24 # 要 存储 的 数据 在 $1 中 ， 将 $1 的 最 高 字 节 存储 到 $2 





而 有 了 swl、swr 指 令 后 ， 只 需要 2 条 指令 即 可 。 如 下 ， 图 9-17 是 对 这 
个 过 程 的 描述 。 


执行 swr 指 令 之 前 的 内 存 





MAL 0 1 2 314 5 6 7/8 9 10 1 
数据 | x0 








J swl $1,7($0) 
执行 swl 指 令 之 后 的 内 存 

地 址 0 1 2 
数据 






图 9-17 组 合 使 用 指令 sw1、swr， 可 以 向 非 对 齐 地 址 存储 字 


9.2 ”加 载 存储 指令 实现 思路 


本 节 介 绍 除 1、sc 之 外 的 加 载 存储 指令 的 实现 思路 ，1、sc 指 令 的 实 
将 在 9.7 专 题 介 绍 。 


1. 加 载 指令 实现 思路 





加 载 指令 在 译 码 阶段 进行 译 码 ， 得 到 运算 类 型 alusel_o、aluop_o， 
以 及 要 写 的 目的 寄存 器 信息 。 这 些 信息 传递 到 执行 阶段 ， 然 后 又 传递 到 
访 存 阶段 ， 访 存 阶段 依据 这 些 信 息 ， 设 置 对 数据 存储 器 RAM 的 访问 信 
号 。 从 RAM 读 取 回 来 的 数据 需要 按照 加 载 指 令 的 类 型 、 加 载 地 址 进行 
对 齐 调整 ， 调 整 后 的 结果 作为 最 终 要 写 入 目的 寄存 器 的 数据 。 








2. 存储 指令 实现 思路 





存储 指令 在 译 码 阶段 进行 译 码 ， 得 到 运算 类 型 alusel o、aluop_o， 
以 及 要 存储 的 数据 。 这 些 信息 传递 到 执行 阶段 ， 然 后 义 传递 到 访 存 阶 
段 ， 访 存 阶段 依据 这 些 信 息 ， 设 置 对 数据 存储 器 RAM 的 访问 信号 ， 将 
Bi ARAM. 





再 要 特别 注意 的 是 : 本章 假设 可 以 在 一 个 时 钟 周期 内 完成 对 外 部 
数据 存储 人 RAM 的 读 、 写 操作 ， 在 后 续 章 市 实现 实践 版 OpenMIPS 处 
理 需 的 时 候 会 考虑 复杂 情况 。 





9.2.1 ”数据 流 图 的 修改 


为 了 实现 除 1、sc 之 外 的 加 载 存储 指令 ， 修 改 数据 流 图 如 图 9-18 所 
示 。 主 要 是 在 访 存 阶段 增加 了 对 数据 存储 器 RAM 的 访问 ， 同 时 ， 由 于 
要 写 入 目的 寄存 器 的 数据 可 能 是 执行 阶段 的 结果 ， 也 可 能 是 在 访 存 阶段 
从 数据 存储 器 RAM 加 载 得 到 的 数据 ， 所 以 在 访 存 阶段 增加 了 一 个 多 路 
选择 器 ， 进 行 选择 。 
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图 9-18 为 了 实现 除 11、sc 之 外 的 加 载 存储 指令 而 修改 的 数据 流 图 


9.2.2 系统 结构 的 修改 


为 了 实现 除 1、sc 之 外 的 加 载 存储 指令 ， 需 要 对 系统 结构 进行 修 
改 ， 增 加 部 分 模块 的 接口 ， 修 改 后 的 系统 结构 如 图 9-19 所 示 。 
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9-19 ”为 了 实现 除 11、sc 之 外 的 加 载 存 储 指令 而 对 系统 结构 的 修改 
主要 修改 内 容 如 下 。 


C1) 译 码 阶段 的 ID 模块 增加 了 输出 信号 inst o， 其 值 就 是 处 于 译 码 
阶段 的 指令 ， 该 信号 会 传递 到 执行 阶段 ， 在 执行 阶段 的 EX 模块 会 利用 
该 信号 的 值 计 算 加 载 、 存 储 地 址 mem_addr_ o。 


(2) 执行 阶段 的 EX 模块 将 运算 子 类 型 aluop_o、 加 载 存 储 地 址 
mem_addr_o、 读 取 的 第 二 个 操作 数 reg2_o 等 信息 ， 通 过 EX/MEM 模 块 传 
递 到 访 存 阶段 的 MEM 模 块 。 


(3) 访 存 阶段 的 MEM 模 块 依据 加 载 、 存 储 指 令 的 类 型 ， 确 定 对 数 
据 存 储 器 RAM 的 访问 信息 ， 通 过 mem_ce_o 接 口 送出 数据 存储 器 使 能 信 
号 ，mem_addr_o 接 口 送出 访问 地 址 ，mem_we_o 接 口 指出 是 加 载 还 是 存 
储 操作 、mem_sel_o 接 口 送出 字 节 选择 信号 ， 如 果 是 存储 指令 ， 那 么 还 
通过 mem_data_o 接 口 输出 要 存储 的 数据 ， 如 果 是 加 载 指令 ， 那 么 会 从 
mem_data_i 接 口 获得 读 取 到 的 数据 ， 然 后 MEM 模 块 依据 具体 的 加 载 指 
令 类 型 、 加 载 地 址 ， 对 获取 的 数据 进行 对 齐 调整 ， 最 终 得 到 要 写 入 目的 
寄存 器 的 数据 。 








9.3 ”修改 OpenMIPS 以 实现 加 载 存 
储 指 令 
9.3.1 修改 译 码 阶段 


1. 修改 ID 模 块 


参考 图 9-19 可 知 ，ID 模 块 要 增加 接口 inst_o， 如 表 9-1 所 示 。 


表 9-1 1D 模 块 新 增加 的 接口 描述 


ih 





在 ID 模 块 还 要 增加 对 加 载 存 储 指令 的 分 析 ， 根 据 图 9-1、 图 9-2、 图 
9-6、 图 9-12 给 出 的 加 载 存 储 指令 的 格式 可 知 ， 这 些 指 令 的 指令 人 码 都 是 不 
同 的 ， 所 以 可 以 直接 依据 指令 码 确 定 是 哪 一 种 指令 ， 确 定 指令 的 过 程 如 
图 9-20 所 示 。 











= EXE LB tb 指 令 | 令 
ana lbu 指 令 


lhu 指 令 wire[5:0] op = inst_i[31:26]; 
E 
lwr 指 令 
ie | 

sh 指令 


swrth 4 








图 9-20 确定 加 载 存储 指令 的 过 程 


其 中 涉及 的 宏 定义 如 下 ， 正 是 各 个 加 载 存 储 指令 的 指令 码 ， 在 本 书 
附带 光盘 Code\Chapter9_1 目 录 下 的 defines.v 文 件 可 以 找到 这 些 定 义 。 





修改 译 码 阶 段 的 有 D 模 块 如 下 。 完 整 代 码 请 参考 本 书 附带 光盘 中 
Code\Chapter9_1 目 录 下 的 id.v 文 件 。 























译 码 工作 主要 是 确定 要 写 的 目的 寄存 器 、 要 读 取 的 寄存 器 和 要 执行 
的 运算 三 个 方面 。 以 下 对 几 个 有 代表 性 的 指令 的 译 码 过 程 进行 说 明 。 


(1) lb 指令 


。 要 写 的 目的 寄存 器 : 加 载 指令 Ib 需 要 将 加 载 结果 写 入 目的 寄存 
器 ， 所 以 设置 wreg_o 为 WriteEnable， 同 时 参考 图 9-1 可 知 ， 要 


Ibu, 


Ri. 





写 的 目的 寄存 器 地 址 是 指令 中 的 第 16 一 20bit， 所 以 设置 wd_o 
为 inst_i[20:16]。 

要 读 取 的 寄存 器 : 参考 图 9-1 可 知 ， 计 算 加 载 目标 地 址 需要 使 
用 到 地 址 为 base 的 寄存 器 值 ， 所 以 设置 regl_read_o 为 1， 表 示 
通过 Regfile 模 块 的 读 病 口 1 读 取 寄存 器 的 值 ， 默 认 读 取 的 寄存 
器 地 址 regl_addr o 是 指令 的 第 21 一 25bit， 正 是 jb 指令 中 的 
base。 上 所 以 最 终 译 码 阶段 的 输出 regl_o 就 是 地 址 为 base 的 寄存 
器 的 值 。 

要 执行 的 运算 : 设置 alusel _o 为 EXE_RES_ LOAD_STORE， 表 
示 运 算 类 型 是 加 载 存 储 ， 设 置 aluop_o 为 EXE_LB_OP， 表 示 运 
算 子 类 型 是 字 节 加 载 lb。 





lh、lhu、1w 指 令 与 lb 指令 的 译 人 码 过 程 类 似 ， 只 是 aluop_o 的 值 


(2) lwl 指 令 








要 写 的 目的 寄存 器 : 加 载 指 令 lwl 需 要 将 加 载 结果 写 入 目的 寄 
存 器 ， 所 以 设置 wreg_o 为 WriteEnable， 同 时 参考 图 9-6 可 知 ， 
要 写 的 目的 寄存 器 地 址 是 指令 中 的 第 16~~20bit， 所 以 设置 
wd_o 为 inst_i[20:16]。 

要 读 取 的 寄存 器 : 参考 图 9-6 可 知 ， 计 算 加 载 目标 地 址 需要 使 
用 到 地 址 为 base 的 寄存 器 值 ， 所 以 设置 regl_read_o 为 1， 表 示 
通过 Regfile 模 块 的 读 端 口 1 读 取 寄存 器 的 值 ， 默 认 读 取 的 寄存 
器 地 址 regl_addr_o 是 指令 的 第 21 一 25bit， 正 是 ]wl 指 令 中 的 
base。 上 所 以 最 终 译 码 阶段 的 输出 regl_o 就 是 地 址 为 base 的 寄存 
器 的 值 。 此 外 ， 由 于 lwl 指 令 只 是 部 分 地 修改 目的 寄存 器 ， 所 
以 还 需要 读 出 目的 寄存 器 ， 与 lwl 指 令 加 载 得 到 的 结果 进行 组 








合 ， 最 终 写 入 目的 寄存 器 ， 因 此 ， 设 置 reg2_read_o 也 为 1， 表 
示 通 过 Regfile 模 块 的 读 端 口 2 读 取 寄存 器 的 值 ， 默 认 读 取 的 寄 
存 器 地 址 reg2_addr_o 是 指令 的 第 16 一 20bit， 正 是 lwl 指 令 中 的 
rt。 所 以 最 终 译 码 阶 段 的 输出 reg2_o 就 是 地 址 为 rt 的 寄存 器 的 
值 。 

要 执行 的 运算 : 设置 alusel _o 为 EXE_RES_ LOAD STORE, & 
示 运 算 类 型 是 加 载 存 储 ， 设 置 aluop_o 为 EXE_LWL_OP， 表 示 
运算 子 类 型 是 向 左 加 载 Iwl。 











lwr 指 令 与 Ilwl 指 令 的 详 码 过 程 类 似 ， 只 是 aluop_o 的 值 不 同 。 


(3) sb 指令 


要 写 的 目的 寄存 器 : 存储 指令 sb 不 需要 写 通 用 寄存 器 ， 所 以 设 
置 wreg_o 为 WriteDisable。 

要 读 取 的 寄存 器 : 参考 图 9-2 可 知 ， 计 算 存 储 目标 地 址 需要 使 
用 的 地 址 为 base 的 寄存 器 值 ， 所 以 设置 regl_read_o 为 1， 表 示 
通过 Regfile 模 块 的 读 端 口 1 读 取 寄存 器 的 值 ， 默 认 读 取 的 寄存 
器 地 址 reg1_addr_ o 是 指令 的 第 21 一 25bit， 正 是 sb 指令 中 的 
base。 上 所 以 最 终 译 码 阶段 的 输出 regl_o 就 是 地 址 为 base 的 寄存 
器 的 值 。 要 存储 的 值 是 通用 寄存 器 的 值 ， 所 以 设置 reg2_read_o 
为 1， 表 示 通 过 Regfile 模 块 的 读 端 口 2 读 取 寄存 器 的 值 ， 默 认 读 
取 的 寄存 器 地 址 reg2_addr_o 是 指令 的 第 16 一 20bit， 正 是 sb 指令 
中 的 rt。 所 以 最 终 译 人 码 阶 段 的 输出 reg2_o 就 是 地 址 为 rt 的 寄存 器 
的 值 。 

要 执行 的 运算 : 设置 alusel_0 为 EXE_RES_LOAD_STORE， 表 
示 运 算 类 型 是 加 载 存 储 指 令 ， 设 置 aluop_o 为 EXE_SB_OP， 表 
示 运 算 子 类 型 是 字 节 存储 sb。 

















sh、sw、swr、swl 指 令 与 sb 指令 的 译 码 过 程 类 似 ， 只 是 aluop_o 的 值 
不 同 。 


2. 修改 ID/EX 模 块 


参考 图 9-19 可 知 ，ID/EX 模 块 需要 增加 部 分 接口 ， 用 于 将 ID 模块 新 
增加 的 输出 信号 inst_o 传 递 到 执行 阶段 的 EX 模块 。 如 表 9-2 所 示 。 


表 9-2 1D/EX 模 块 新 增加 的 接口 描述 


e 号 | 接口 名 | 宽度 cotb | mams | Er | 
当前 处 于 详 码 阶段 的 指 人 
当前 处 于 执行 阶段 的 指令 


修改 译 码 阶段 的 ID/EX 模 块 如 下 。 完 整 代码 位 于 本 书 附带 光盘 中 
Code\Chapter9_1 目 录 下 的 id_ex.v 文 件 中 。 








9.3.2 ”修改 执行 阶段 


1. 修改 EX 模块 





在 执行 阶段 的 EX 模块 会 计算 加 载 存 储 的 目的 地 址 ， 参 考 图 9-19 可 
知 ，EX 模 块 会 增加 部 分 接口 ， 如 表 9-3 所 示 。 


表 9-3 EX 模块 新 增加 接口 的 描述 


当前 处 于 执行 阶段 的 指令 
执行 阶段 的 指令 要 进行 的 运算 子 类 型 








载 、 存 储 指令 对 应 的 存储 器 地 址 
存储 指令 要 存储 的 数据 , 或 者 Iwl、lwr 指令 
要 加 载 到 的 目的 寄存 器 的 原始 值 





修改 执行 阶段 的 EX 模块 如 下 。 完 整 代码 位 于 本 书 附 带 光 盘 中 
Code\Chapter9_1 目 录 下 的 ex.v 文 件 中 。 








2， 修 改 EXMEM 模 块 


参考 图 9-19 可 知 ，EX/MEM 模 块 会 增加 部 分 接口 ， 用 于 将 EX 模块 新 
增 的 输出 传递 到 访 存 阶段 ， 增 加 的 接口 描述 如 表 9-4 所 示 。 


表 9-4 EX/MEM 模 块 新 增加 接口 的 描述 


宽度 (bit) | 输入 /输出 
丸 行 阶 段 的 指令 要 进行 的 运算 的 子 类 型 


价 段 的 加 载 、 存 储 指 令 对 应 的 存储 器 


eX_aluop 


ex_mem_addr 


阶段 的 指令 要 进行 的 运算 的 


价 段 的 加 载 、 存 储 指令 对 应 的 存储 器 


mem aluop 


mem mem addr 
mem_reg? 


修改 执行 阶段 的 EX/MEM 模 块 如 下 ， 只 是 一 个 简单 的 传递 操作 ， 当 
流水 线 的 执行 阶段 没有 被 暂停 时 ， 将 来 自 执 行 阶段 EX 模块 的 输出 传递 
到 访 存 阶段 。 完 整 代码 请 参考 本 书 附带 光盘 Code\Chapter9_ 1 目录 下 的 


ex_mem.v 文 件 。 




















价 段 的 存储 指令 要 存储 的 数据 ， 或 者 
A. lwr 指令 要 写 入 的 目的 寄存 器 的 原始 值 


EB hl: 
行 阶 段 的 存储 指令 要 存储 的 数据 ， 或 者 
A lwr 指令 要 写 入 的 目的 寄存 器 的 原始 值 














module ex_mem( 


// 为 实现 加 载 、 存 储 指令 而 添加 的 输入 接口 


input wire[ AluopBus | ex_aluop, 
input wire[ RegBus] ex_mem_addr, 
input wire[ RegBus | ex_reg2, 


// 为 实现 加 载 、 存 储 指令 而 添加 的 输出 接口 
output reg[ AluOpBus] mem_aluop, 
output reg[ RegBus] mem_mem_addr, 


output reg[ RegBus | mem_reg2, 








9.3.3 ”修改 访 存 阶段 


访 存 阶段 主要 是 修改 MEM 模 块 ， 参 考 图 9-19 可 知 ， 需 要 为 其 添加 
对 数据 存储 器 RAM 的 访问 接口 ， 添 加 的 接口 描述 如 表 9-5 所 示 。 


表 9-5 MEM 模 块 新 增加 接口 的 描述 


ME 用 


TI 


fe O 名 








. 访 存 阶段 的 加 载 、 存 储 指令 对 应 的 存储 器 
2 mem addr i | 32 输入 地 十 


宽度 (bit) 输入 /输出 


eae 
访 存 阶段 的 存储 指令 要 存储 的 数据 ， 或 者 
reg2 i A 
lwl, Iwr 指令 要 写 入 的 目的 寄存 器 的 原始 值 
— i 


4 
5 


从 数据 存 人 


mem data i 
CO ETE: 


存储 器 的 地 址 
6 mem we o 是 否 是 写 操作 ， 为 1 表示 是 写 操作 
7 mem sel o 输出 字 节 选择 信和 号 
8 mem data o | 3 mtl 要 写 入 数据 存储 器 的 数据 
9 mem ce o al 数据 存储 器 使 能 信号 


从 图 9-19 可 知 ， 表 9-5 后 面 的 几 个 新 增 接口 mem_data_i、 
mem_ addr 0、mem we 0、mem sel o、mem_data_o、mem_ce_o 都 是 与 
数据 存储 器 相连 的 ， 其 中 大 部 分 接口 的 作用 都 很 好 理解 ， 此 处 只 对 
mem_sel 0 做 进一步 说 明 ， 分 加 载 、 存 储 两 种 操作 分 别 说 明 。 





























(1) 对 于 加 载 操作 ，MIPS32 指 令 集 架 构 中 定义 的 加 载 指 令 可 以 加 
载 字 节 、 半 字 、 字 ， 但 是 数据 总 线 的 宽度 是 32 位 ， 占 4 个 字 节 。 如 果 执 
行 加 载 字 节 指令 b、lbu， 那 么 就 要 知道 通过 数据 总 线 输入 的 4 个 字 节 
中 ， 哪 个 字 节 是 要 读 取 的 数据 ， 如 果 执 行 加 载 半 字 指 令 h、lhu， 那 么 就 
要 知道 哪个 半 字 是 要 读 取 的 数据 ，mem_sel_o 的 作用 就 是 指出 哪 一 部 分 
是 有 效 数 据 。mem_sel_o 和 宽度 为 4， 分 别 对 应 数据 总 线 的 4 个 字 方 ， 比 
u: 使 用 加 载 指 令 lb 读 取 数 据 存 储 器 地 址 0x1 处 的 字 节 ， 那 么 可 以 设置 
mem_sel_0 为 4b0100， 意 思 就 是 ， 基 户外 部 存储 器 在 输出 数据 时 ， 将 地 
址 0x1 处 的 字 节 放 在 32 位 数据 总 线 的 次 高 字 节 ， 也 就 是 第 16 一 23bit 的 位 
置 ， 当 数据 送 到 处 理 器 时 ， 处 理 器 就 取出 其 中 第 16 一 23bit 对 应 的 字 贡 ， 
作为 数据 存储 器 地 址 0x1 处 的 值 。 











(2) 对 于 存储 操作 ，MIPS32 指 令 集 染 构 中 定义 的 存储 指令 可 以 存 
储 字 节 、 半 字 、 字 ， 但 是 数据 总 线 的 宽度 是 32 位 ， 占 4 个 字 节 ， 如 果 执 
行 字 节 存储 指令 sb、 半 字 存 储 指令 sh， 那 么 外 部 数据 存储 器 就 要 知道 通 
过 数据 总 线 传递 过 来 的 4 个 字 节 中 ， 哪 个 字 节 、 哪 个 半 字 是 要 存储 的 数 








据 ，mem_sel_o 的 作用 就 是 指出 哪 一 部 分 是 要 存储 的 有 效 数 据 。 比 如 : 
使 用 存储 指令 sh 向 地 址 0x2 处 存储 0x8281， 那 么 可 以 设置 mem_data_o 为 
0x82818281、 设 置 mem_sel_o 为 4?b0011， 这 样 外 部 存储 器 就 知道 要 存储 
的 数据 是 0x82818281 的 最 低 两 个 字 节 ， 正 是 0x8281。 


访 存 阶段 MEM 模 块 的 代码 主要 修改 如 下 ， 完 整 代码 请 读者 参考 本 
书 附带 光盘 中 Code\Chapter9_1 目 录 下 的 mem.v 文 件 。 









































OpenMIPS 


(1) 读 取 地 址 mem_addr_o 的 字 节 





(2) 返回 地 址 {mem_addr_o[31:2],2'b00} 的 字 
4 











ME E 











(3) 依据 mem_addr_o[1:0] 的 
值 ， 确 定 最 终 要 读 取 的 字 节 


nem_addr_o[1:0] 



































(1) 将 e 写 入 地 址 mem_addr_ o。 依 据 
mem_addr_o[1:0] 的 值 ， 给 出 mem_sel_o 的 值 




















ele 





(2) hbk {mem_addr_o[31:2],2'b00 
对 应 的 字 是 





(3) 依据 mem_sel_o 的 值 ， 
确定 最 终 要 写 入 的 字 节 


mem_sel_o[3:0] 


4'b1000 
4'b0100 
4'b0010 
4'b0001 


























序 号 a| to 作 A 
输入 
是 理 是 对 数据 存储 器 的 写 操作 ， 为 1 表示 是 写 操作 








a _ | 


数据 存储 器 使 能 信和 号 


ram ce o 


rom ce 0 
rom_addr_o 
ram_ce_o 
ram_addr_o 
ram_data_o 
ram_sel_o 
ram we_o 








data ram.v 





3 du AA 有 图 
IF m 


序 号 | 接口 名 | 宽度 (bit) | AGE 
aoo | 
Cr 

















OpenMIPS 
rst rom ce_o 
clk rom_addr_o 
rom_data_i 


openmips.v 


data_ram.v 











srl 


sb 


lb 
lbu 


$3, $3,8 
$3, 0x0 ($0) 


$1, 0x3($0) 
$1,0x2($0) 


HAHAHAHA RAR 


ori 


sh 


lhu 
1h 


ori 


sh 


1h 
lhu 


$3, $0, 0xaabb 
$3, 0x4($0) 


$1,0x4($0) 


$1,0x4($0) 


$3, $0, 0x8899 


$3,0x6($0) 


$1,0x6($0) 
$1,0x6($0) 


HAHAHAHA 


第 三 段 : 测试 sw、lw、lwl、lwr 指 令 


# 逻辑 右 移 8 位 ，$3 = 0x000000cc 





# 癌 RAM 地 址 90x9 处 存储 0xcc， [0x0] = Oxcc 


# 加 载 0x3 处 的 字 节 并 作 符 号 扩展 ，$1 = oxfffff 
# 加 载 0x2 处 的 字 节 并 作 无 符号 扩展 ，$1 = Ox000( 
BG 测试 sh、1Lh、1Lhu 指 令 HHH 
# $3 = 0x0000aabb 


# 向 RAM 地 址 9x4 处 存储 0xaabb， 
# [0x4] = Oxaa, [0x5] = Oxbb 





# 加 载 0x4 处 的 半 字 并 作 无 符号 扩展 ，$1 = Qx000( 
# 加 载 0Xx4 处 的 半 字 并 作 符 号 扩展 ，$1 = Oxffffa 


# $3 = 0x00008899 
# 向 RAM 地 址 9x6 处 存储 0x8899， 
# [0x6] = 0x88, [0x7] = 0x99 


# 加 载 0X6 处 的 半 字 并 作 符 号 扩展 ，$1 = 0xffff8 
# 加 载 0x6 处 的 半 字 并 作 无 符号 扩展 ，$1 = Ox000( 





HHHHHHHHHR 


# 经 过 上 面 指令 的 执行 ， 此 时 RAM 的 内 容 如 下 
# [0x0] = Oxcc, [0x1] = Oxdd 
# [0x2] = Oxee, [0x3] = Oxff 








reg[3] 就 是 $3 的 值 


reg[1] 就 是 $1 的 值 | 
(1) 第 一 段 代 码 ，sb、lb、lbu 的 执行 效果 





ipoooaabb 可 00088 
000000ee 0000aabb Jffffaabb jss99 jo0008899 


(2) 第 二 段 代 码 ，sh、ih、lhu 的 执行 效果 


(3) 第 三 段 代 三，sw、lw、lwl、1wir 的 执行 效果 


I EE If kl 


44556677 


(4) 第 四 段 代 码 ，swl、swr 的 执行 效果 








LL 
110000 
SC 
111000 
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— p LLbit_i 





LLbit_we_o 
LLbit_value_o 


wb_LLbit_we_i 
wb_LLbit_value_i 


|__| mem_LLbit_we 
I >| mem_LLbit_value 








wb_LLbit_we 
wb_LLbit_value 
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LLbit 





| 





LLbit i  LLbit_o 
flush 
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clk 

















LLbit_reg.v 

















要 写 到 LLbit 寄存 器 的 值 
Loi ef 








wire[5:0] op = inst_i[31:26 














IE 
SIE 


= Yeti 

回 写 阶段 的 指令 是 否 要 写 LLbit 寄存 器 
回 写 阶段 要 写 入 LLbit 寄存 器 的 值 

访 存 阶段 的 指令 是 否 要 写 LLbit 寄存 器 


访 存 阶 段 的 指令 要 写 入 LLbit 寄存 器 的 值 


it) | 输入 /输出 用 
LLbit i LLbit 模块 给 出 的 LLbit 寄存 器 的 值 
it BE 


=O 
fx HB 




















用 


A = | 宽 m 
1 访 存 阶段 的 指令 是 否 要 写 LLbit 寄存 器 
Y $ 1 


EN 
ao er | Sa 
Tos 


接 E 


回 写 阶段 的 指令 是 否 要 写 LLbit 寄存 器 


回 写 阶 段 的 指令 要 写 入 LLbit 寄存 器 的 值 























DO 加 载 指 令 Iw 在 访 存 阶段 
获得 要 写 入 通用 寄存 器 $1 的 值 























© OEP 















w $1, 0x0($0) a KB KC 执行 | 


eq $1, $2, Label 《 取 指 水 、 译 码 : 





(3) 而 指令 beq 在 上 一 时 钟 周期 ， 也 就 
是 处 于 译 码 阶段 时 ， 就 已 经 比较 了 通用 
寄存 器 $1 与 $2 的 值 ， 并 判断 是 否 转移 





(2) 此 时 指令 beq 处 于 执行 阶段 


(3) 加 载 指令 lw 在 访 存 阶段 获得 
要 写 入 通用 寄存 器 $1 的 值 ， 该 值 
会 被 推送 到 译 码 阶段 











Iw $1, 0x0($0) CE | € | 
beq $1, $2, Label ID EED HK BE UE > 








C1) 在 此 阶段 检测 到 了 load 相 关 ，beq 


rst 
stallreq_from_id 





etrl.v 


ex_aluop_i 














序 = | # A 名 | = BE (b t) 1 输入 /输出 4 用 
oo Temei Ce 

















sto 
Sti 
1/regs[1] (000... [00001234 joooooo00 00001234 可 00089ab _ 





第 10 革 ” 协 处 理 器 访问 指令 的 实现 


本 章 首 先 介 绍 MIPS32 架 构 中 的 协 处 理 器 ， 说 明了 协 处 理 器 的 作 
用 。 由 于 OpenMIPS 计 划 实 现 其 中 的 一 个 协 处 理 器 一 一 CP0， 所 以 10.2 节 
专题 介绍 CP0， 然 后 在 10.3 节 实现 协 处 理 器 CP0， 其 实现 方式 有 点 类 似 
HI、LO 寄 存 器 的 实现 方式 。10.4 节 说 明 协 处 理 器 访问 指令 mfc0、mtc0 的 
格式 、 作 用 、 用 法 。10.5 市 给 出 了 协 处 理 器 访问 指令 的 实现 思路 ， 以 及 
对 系统 结构 的 修改 。10.6 闻 通过 修改 OpenMIPS， 实 现 了 协 处 理 器 访问 
指令 ， 最 后 编写 测试 程序 ， 在 ModelSim 中 进行 仿真 验证 。 














10.1 DACHTE 


协 处 理 器 一 词 通 常用 来 表示 处 理 器 的 一 个 可 选 部 件 ， 负 责 处 理 指 令 
集 的 某 个 扩展 ， 有 具有 与 处 理 器 核 独立 的 寄存 器 。MIPS32 架 构 提供 了 最 
多 4 个 协 处 理 器 ， 分 别 是 CP0~CP3， 作 用 如 表 10.1 所 示 。 








表 10.1 MIPS32 架 构 定 义 的 协 处 理 器 及 其 作用 





协 处 理 器 作 H 
CP1 FPU 
CP3 FPU 


协 处 理 器 CP0 用 作 系 统 控制 ，CP1、CP3 用 作 浮 点 处 理 单元 ， 而 CP2 
被 保留 用 于 特定 实现 。 除 CP0 外 的 协 处 理 器 都 是 可 选 的 ，OpenMIPS 没 
有 实现 浮 点 运算 ， 所 以 CP1、CP3 不 用 实现 ，CP2 也 没有 作用 ， 不 用 实 
现 。 而 CP0 是 不 可 选 的 ， 需 要 实现 ， 所 以 下 面 重点 介绍 协 处 理 器 CP0。 


截至 本 章 ， 我 们 的 OpenMIPS 处 理 器 实现 了 很 多 指令 ， 但 这 些 指令 
都 是 用 来 运算 的 ， 实 际 的 处 理 器 还 要 支持 其 他 广泛 的 操作 ， 例 如 : 中 断 
处 理 、 提 供 可 选 的 配置 、 观 察 并 控制 系统 缓存 或 时 钟 、 地 址 转换 等 。 
MIPS32 架 构 定 义 的 协 处 理 器 CP0 的 作用 就 是 协助 实现 上 述 的 广泛 操作 。 
CP0 负 责 的 主要 工作 如 下 。 


。 配置 CPU 工 作 状 态 : 符合 MIPS32 架 构 的 硬件 通常 是 很 灵活 
的 ， 可 以 通过 读 / 写 一 个 或 一 些 内 部 寄存 器 来 改变 一 些 很 根本 
的 CPU 特性 〈 如 : 将 字 节 次 序 从 MSB 变 为 LSB， 或 者 从 LSB 变 
为 MSB) 。 

高 速 缓存 控制 : 符合 MIPS32 架 构 的 CPU 一 般 会 集成 缓存 控制 
器 ， 用 来 控制 、 读 、 写 缓存 。 

异常 控制 异常 发 生 时 的 检测 和 处 理 都 由 CP0 中 的 一 些 控制 寄 
存 器 来 定义 和 控制 。 

存储 管理 单元 控制 : “对 系统 的 存储 区 域 进行 合理 的 控制 、 管 
理 和 分 配 ， 主 要 是 对 MMU、TLB 的 一 些 配置 、 管 理 、 访 问 。 
其 他 : ，” 当 要 把 额外 的 功能 集成 在 CPU 中 ， 但 又 不 方便 当 作 外 
设 访问 时 ， 和 常常 在 CP0 中 增加 一 些 模块 以 实现 这 些 功 能 。 例 
如 : 时 钟 、 时 间 计 数 器 、 奇 偶 校 验 错误 检测 等 。 














10.2” 协 处 理 器 CP0 中 的 寄存 器 


CP0 中 有 一 系列 寄存 器 用 来 完成 上 述 工 作 。 如 表 10-2 所 示 。 


%10-2 CP0 中 的 寄存 器 描述 





un FEA 功能 描述 备 注 
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EntryLo0 3 这 些 都 是 与 
内 存 管 理 

Kr EH TL HY MMU, Hi 

EntryLol 和 低位 址 翻译 快 表 


TLB 有 关 的 


AIR ME p ay TF at 
i 

23 t5] A 

73 | Pal az 


Wired 





8 BadVAddr 记录 最 近 一 次 地 址 
a 异常 的 地 址 


与 内 存 ies 
MMU, } 
EntryHi ie 地 址 的 高 址 翻译 快 表 
TLB 有 关 的 
pr a dir 


EE 
制 寄 存 器 ， 包 括 
决定 CPU 特权 等 
级 ， 使 能 哪些 中 


保存 上 一 次 异常 
Fer 的 程序 计数 器 
m Es 

Config 来 设置 CPU 的 参 > 
数 


加 载 链接 指令 要 加 
17 LLAddr 载 的 数据 存储 器 地 
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Pf 















| pane 


== e e 
上 一 次 调试 异常 的 ‖ 
程序 计数 器 


观测 点 watchpoint 
DN ECO 







与 调试 有 关 


R 
7 ES | ee 
» ES | | 
上 一 次 系统 错误 时 





用 于 调试 处 理 的 暂 een 


从 表 中 可 以 发 现 有 很 多 寄存 器 都 是 与 缓存 、MMU、TLB、 调 试 有 
关 的 ， 而 OpenMIPS 的 设计 目标 是 一 个 轻 量 级 的 处 理 器 ， 并 不 打算 实现 
缓存 、MMU、TLB、 调 试 等 复杂 功能 ， 所 以 相关 的 寄存 器 都 可 以 不 用 








实现 ， 本 书 也 不 再 介绍 这 些 寄存 器 ， 该 者 只 需 注意 表 中 使 用 加 粗 、 和 斜体 
标注 的 7 个 寄存 器 即 可 ， 下 面 依次 介绍 这 7 个 寄存 器 的 格式 、 作 用 。 


1. Count 寄存 器 〈 标 号 为 9 ) 


Count 寄 存 器 是 一 个 不 停 计 数 的 32 位 寄存 器 ， 计 数 频 率 一 般 与 CPU 
时 钟 频 率 相 同 ， 当 计数 达到 32 位 无 符号 数 的 上 限时 ， 会 从 0 开始 重新 计 
数 。Count 寄 存 器 可 读 、 可 写 。 其 字段 如 表 10-3 所 示 。 


表 10-3 Count 寄存 器 的 字段 





Bit 31-0 


2. Compare% Fé (Pn N11) 


Compare 寄 存 器 是 一 个 32 位 的 寄存 器 ， 与 Count 寄 存 器 一 起 完成 定时 
中 断 功 能 。 当 Count 寄 存 器 中 的 计数 值 与 Compare 寄 存 器 中 的 值 一 样 时 ， 
会 产生 定时 中 断 。 这 个 中 断 会 一 直人 保持， 直到 有 数据 被 号 入 Compare 寄 
存 器 。Compare 寄 存 堪 可 读 、 可 写 。 其 字段 如 表 10-4 所 示 。 














表 10-4 Compares FB 09 F FR 





Bit 31-0 


3. Status 寄 存 器 (标号 为 12) 


Status 和 寄存 器 也 是 一 个 32 位 、 可 读 、 可 写 的 寄存 器 ， 用 来 控制 处 理 
峰 的 操作 模式 、 中 断 使 能 以 及 诊断 状态 。 其 字段 如 表 10-5 所 示 。 


#10-5 _ Status 寄存 器 的 各 个 字段 





标志 名 
i 18-16 15-8 7-5 
示 志 名 IM7-IMO EXL | IE 


表 10-5 中 标识 为 R 的 字段 是 保留 字段 ， 下 面 逐 一 介绍 其 中 的 非 保留 








字段 。 读 者 朋 友 如 果 没 有 时 间 ， 可 以 只 理解 其 中 使 用 灰色 背景 的 字段 ， 
OpenMIPS 处 理 器 也 只 实现 了 这 些 字 上 段 。 


e CU3-CU0 


表示 协 处 理 器 是 否 可 用 (Coprocessor Usability) ， 分 别 控制 协 处 理 
器 CP3、CP2、CP1、CP0。 为 0 时 ， 表 示 相 应 的 协 处 理 器 不 可 用 ; 为 1 
时 ， 表 示 相 应 的 协 处 理 器 可 用 。 对 于 OpenMIPS 处 理 器 而 言 ， 只 有 协 处 
理 嚣 CP0， 所 以 可 以 设置 本 字段 为 4b0001。 


e RP 


表示 是 否 启 用 低 功 耗 模式 (Reduced Power) ， 但 是 否 实现 以 及 如 
何 实现 是 同 具 体 处 理 器 相关 的 ， 比 如 : 有 的 处 理 器 可 以 通过 降低 工作 频 
率 、 工 作 电 压 ， 来 实现 低 功 耗 ，OpenMIPS 处 理 器 没有 实现 这 些 功能 ， 
所 以 本 字段 并 没有 作用 。 





e RE 











用 来 改变 用 户 态 模式 下 的 字 节 次 序 ，1 表 示 改 变 ，0 表 示 不 改变 ， 





MIPS 处 理 器 可 以 在 复位 的 时 候 配 置 工作 在 大 端 模 式 (MSB) 还 是 小 端 
IN (LSB) ， 工 作 在 用 户 态 模式 下 的 软件 可 以 通过 设置 此 处 的 RE 字 
段 ， 改 变 大 小 端 模式 。OpenMIPS 处 理 器 没有 实现 此 项 功能 ， 固 定 工作 
在 大 端 模 式 ， 所 以 本 字段 并 没有 作用 。 





e BEV 


表示 是 否 使 用 启动 异常 向 量 (Bootstrap Exception Vector) ， 为 0 表 
MEAR AE, MRS MA IA AE, EL RANA: 启动 
异常 向 量 对 应 的 异常 处 理 例 程 入 口 地 址 位 于 不 能 被 缓存 、 不 能 被 MMU 
映射 的 内 存 空间 。 在 系统 刚刚 启动 的 时 候 ， 绥 存 、MMU 都 没有 准备 
好 ， 此 时 只 能 使 用 局 动 异 和 党 问 量 ， 人 否则 可 能 会 出 错 。 对 OpenMIPS 处 理 
器 而 言 ， 没 有 缓存 、 也 没有 MMU， 采 用 的 异常 处 理 机 制 也 相对 简化 了 
许多 (在 第 11 章 会 详 述 ) ， 所 以 本 字段 并 没有 作用 。 











e TS 





表示 是 否 关 闭 TLB (TLB Shutdown) ， 为 1 表示 关闭 TLB， 为 0 表示 
打开 TLB。OpenMIPS 处 理 器 没有 实现 TLB， 所 以 本 字段 并 没有 作用 。 








表示 是 否 是 软 重 启 (Soft Reset) ， 为 1 表示 重启 异常 是 由 软 重 启 引 


e NMI 











表示 是 否 是 不 可 屏蔽 中 断 〈Non-Maskable Interrupt) ， 为 1 表示 重启 
异常 是 由 不 可 屏蔽 中 断 引 起 的 。 








e IM7-IMO 





表示 是 否 屏蔽 相应 中 断 〈Interrupt Mask) , ORIRE ENTE 
疝 ，MIPS 处 理 器 可 以 有 8 个 中 断 源 ， 对 应 IM 字 段 的 8 位 ， 其 中 6 个 中 断 源 
是 处 理 器 外 部 硬件 中 断 ， 另 外 2 个 是 软件 中 断 ， 中 断 是 否 能 够 被 处 理 器 
啊 应 是 由 Status 寄 存 器 与 Cause 寄 存 器 共同 记 定 的 ， 如 果 Status 寄 存 器 的 
IM 字 段 与 Cause 和 寄存器 的 卫 字 段 的 相应 位 都 为 1， 而 且 Status 寄 存 堪 的 本 
字段 也 为 1 时 ， 处 理 器 才 啊 应 相应 中 断 。 


e UM 





表示 是 否 为 用 户 模 式 (User Mode) ， 为 1 表示 处 理 器 运行 在 内 核 模 
式 ， 为 0 表示 处 理 器 运行 在 用 户 模式 。OpenMIPS 处 理 需 在 实现 的 时 候 并 
没有 区 分 内 核 模 式 、 用 户 模 式 ， 两 种 模式 下 的 权限 是 一 样 的 ， 都 可 以 访 
问 处 理 右 的 所 有 资产， 所 以 本 字段 并 没有 作用 。 





e ERL 





表示 是 否 处 于 错误 级 ， 当 处 理 器 接收 到 坏 的 数据 时 设置 本 字段 为 
1。 有 一 些 MIPS 处 理 器 在 接收 来 自 绥 存 或 内 存 中 的 数据 块 时 ， 能 够 检验 
数据 中 附带 的 奇偶 校 验 位 或 纠 错 码 ， 当 发 现 数据 错误 且 无 法 纠正 时 ， 处 
理 器 就 设置 ERL 字 段 为 1， 并 进入 奇偶 校 验 \ECC 错 误 的 异常 处 理 过 程 ， 
这 是 一 个 特殊 的 异常 处 理 过 程 《有 别 于 一 般 的 异常 处 理 过 程 》。 读 者 只 
需 知道 ，OpenMIPS 处 理 器 没有 对 奇偶 校 验 位 或 纠 错 码 的 检验 过 程 ， 所 
以 不 用 考虑 ERL 字 段 。 




















表示 是 否 处 于 异常 级 (Exception Level) ， 当 异常 发 生 时 ， 会 设置 





本 字段 为 1， 表 示 处 理 器 处 于 弄 帝 级， 此 时 ， 处 理 器 会 进入 内 核 模式 下 
TAE, FAR HB. 


e [E 


表示 是 否 使 能 中 断 (Interrupt Enable) ， 这 是 全 局 中 断 使 能 标志 
位 。 为 1 表示 中 断 使 能 ， 为 0 表示 中 断 禁 止 。 


4. Cause 寄 存 器 〈 标 号 为 13) 


Cause 寄 存 器 主要 记录 最 近 一 次 异 稼 发生 的 原因 ， 也 控制 软件 中 断 
请 求 。Cause 寄 存 器 的 各 字段 如 表 10-6 所 示 ， 除 了 IP[1:0]、IV 和 WP， 其 
余 字 段 都 是 只 读 的 。 


#10-6 Cause 寄存 器 的 各 个 字段 


31 30 29-28 27 26 25-24 23 22 21-16 
BD R CE DC PCI 0 IV WP 0 
a 





feito 
Pera oy fo eee 
表 10-6 中 标识 为 R 的 字段 是 保留 字段 ， 下 面 逐 一 介绍 其 中 的 非 保留 
字段 。 读 者 朋友 如 果 没 有 时 间 ， 可 以 只 理解 其 中 使 用 灰色 背景 的 字段 ， 
OpenMIPS 处 理 器 也 只 实现 了 这 些 字段 。 








e BD 


ARA HFRS Ab Fo SC EIR (Branch DelaySlot) 时 ， 该 字段 
被 置 为 1。 


e CE 


当 协 处 理 占 不 可 用 异常 发 生 时 ， 将 发 生 协 处 理 器 错误 (Coprocessor 
Error) 的 协 处 理 器 序号 存储 到 本 字段 。 


e DC 


这 是 在 MIPS32/64 架 构 中 新 增加 的 字段 ， 将 其 置 为 1， 可 以 使 Count 
寄存 器 集 止 计数 ， 这 样 做 的 目的 之 一 是 减少 功 耗 。 


e PCI 


这 是 在 MIPS32/64 架 构 中 新 增加 的 字段 ， 当 协 处 理 器 CP0 的 性 能 计 
BCs yan HAY (Performance Count Interrupt) ， 设 置 本 字段 为 1， 以 产生 中 


e IV 


中 汤 问 量 (Interrupt Vector) 的 选择 与 此 字段 有 关 ， 将 该 字段 置 为 0 
表示 使 用 一 般 中 断 问 量 ， 反 之 ， 表 示 使 用 特殊 中 断 问 量 。OpenMIPS 处 
理 器 通过 一 种 简单 的 异常 癌 量 表 的 方式 来 处 理 中 断 〈 在 第 11 章 会 有 详 
R) ， 所 以 这 个 字段 没有 作用 。 








e WP 





观测 挂 起 (Watch Pending) 字段 ， 该 字段 与 调试 有 关 ， 为 1 表示 有 
一 个 观测 点 被 触 友 ， 处 理 器 处 于 异常 模式 。 


e IP[7:2] 


中 断 挂 起 (Interrupt Pending) 字段 ， 相 应 位 用 来 指明 外 部 硬件 中 断 
是 否 发 生 ，1 表 示 发 生 ，0 表 示 没 有 发 生 。 本 字段 的 6 位 与 外 部 硬件 中 断 


的 对 应 关系 如 下 。 
IP[7] 一 一 5 号 硬件 中 断 
IP[6] 一 一 4 号 硬件 中 断 
IP[5] 一 一 3 号 硬件 中 断 
IP[4] 一 一 2 号 便 件 中 暑 
IP[3] 一 一 1 号 硬件 中 断 
IP[2] 一 一 0 号 硬件 中 断 


e IP[1:0] 





也 是 中 断 挂 起 字段 ， 但 是 对 应 的 是 软件 中 断 。 
IP[1] 一 一 1 守 软 件 中 断 
IP[0] 一 一 0 号 软件 中 断 

e ExcCode 


本 字段 是 一 个 5 位 的 编码 ， 用 来 记录 发 生 了 哪 种 异常 ，ExcCode 编 码 
的 含义 如 表 10-7 所 示 。 其 中 很 多 与 MMU、Cache、TLB 等 模块 有 关 ， 而 
我 们 的 OpenMIPS 处 理 器 并 没有 实现 这 些 模 块 ， 所 以 相应 的 异常 也 不 用 
考虑 。 读 者 朋友 如 果 没 有 时 间 ， 可 以 只 理解 其 中 使 用 灰色 背景 的 
ExcCode 编 码 ，OpenMIPS 只 实现 了 对 这 几 种 异常 的 处 理 ， 所 以 也 只 使 用 
这 些 编码 。 





表 10-7 ExcCode 的 编码 及 其 含义 










ExcCode 编 
Ay 


助 记 符 
t 


In 


| 
SH 


Mod TLB 修 改 异 稼 或 者 保留 











TLB 加 载 异 常 或 者 取 指 异常 或 者 保留 
加 载 或 取 指 过 程 中 ， 地 址 错误 异常 
存储 过 程 中 ， 地 址 错误 异 党 

IBS 取 指 过 程 中 ， 总 线 错误 异常 

DBE ER 

Sys 系统 调用 指令 Syscall 


断 点 异常 

执行 未 定义 指令 引起 的 异常 
CpU 协 处 理 器 不 可 用 异常 

整数 溢出 异常 

自 陷 指令 引起 的 异常 

保留 


DI 


i i 
7 
a» : 
i 
A? 
; 


V 


14-22 


N =. 上 一 Ra = N ul E CD N 上 一 
UY UY N 上 一 o 


T 


WATCH 访问 WatchHiNWatchLo 地 址 


AAA) 


Hei Ark, .CPU 检测 到 CPU 控制 系统 中 


5. EPC 寄 存 器 (标号 为 14) 





EPC 是 异常 程序 计数 器 (Exception Program Counter) ， 用 来 存储 异 
党 返回 地 址 ， 一 般 情况 下 ， 存 储 发 生 异 常 的 指令 的 地 址 ， 但 是 ， 如 果 发 
生 异 党 的 指令 位 于 延迟 槽 中 ， 那 么 EPC 存 储 的 是 前 一 条 转移 指令 的 地 
址 。 该 寄存 器 可 读 、 可 写 。 其 字段 如 表 10-8 所 示 。 





表 10-8 EPC 寄存器 的 字段 





6. PRIdA HA (in Ss N15) 


PRId 寄 存 器 是 处 理 器 标志 (Processor Identifier) 寄存 器 ， 包 含 的 信 
BA: 制造 丙 信 息 、 人 处 理 器 类 型 以 及 处 理 器 的 版 本 等 。 各 个 字段 如 表 
10-9 所 示 。 其 中 R 是 保留 字段 。 


表 10-9 PR1d 寄 存 器 的 各 个 字段 


[eid z wo p 
标志 名 





e Te e [rain 
各 个 字段 的 含义 如 下 。 


e Company ID 
指明 设计 或 生产 该 处 理 器 的 公司 。 


e Processor ID 





指明 处 理 器 的 类 型 ， 软 件 可 以 依据 这 个 字段 来 区 分 不 同类 型 的 
MIPS 处 理 需 。 


e Revision 





指明 处 理 器 的 版 本 号 ， 软 件 可 以 依据 这 个 字段 来 区 分 同类 型 处 理 器 
的 不 同 版 本 。 


7. Config 寄 存 器 《标号 为 16) 


Config 寄 存 器 包含 了 与 处 理 器 有 关 的 各 种 配置 和 功能 信息 ， 其 各 个 
字段 如 表 10-10 所 示 ， 大 部 分 字段 由 硬件 在 重 局 时 进行 初始 化 ， 或 定 为 


25 
T Eo 


表 10-10 Config 寄存 器 的 各 个 字段 








各 个 字段 的 含义 如 下 。 有 一 些 字 段 是 与 MMU、TLB、Cache 等 模块 
有 关 ， 读 者 朋友 如 果 没 有 时 间 ， 可 以 只 理解 其 中 使 用 灰色 背景 的 字段 。 





e M 








表示 是 否 存 在 Configl 寄 存 器 ，MIPS32 架 构 中 实际 定义 了 4 个 配置 寄 
存 器 : Config、Config1-3，OpenMIPS 处 理 器 只 实现 了 Config 寄 存 器 ， 所 





以 OpenMIPS 在 初始 化 的 时 候 需 要 设置 本 字段 为 0， 表 示 没 有 Config1 寄 
存 器 。 


e Impl 


这 是 与 实现 相关 的 配置 标记 ，MIPS32 架构 的 处 理 器 会 在 本 字段 设 
置 一 些 自 定义 的 信息 ，OpenMIPS 处 理 器 没有 使 用 本 字段 。 


e BE 








其 值 为 1 表示 处 理 器 工作 在 大 端 模式 〈《MSB ) ， 为 0 表示 处 理 器 工作 
在 小 端 模式 (LSB) 。OpenMIPS 处 理 器 工作 在 大 端 模式 ， 所 以 设置 本 
字段 为 1。 


e AT 


ESTREMERA (Architecture Type) 字段 ， 当 其 值 为 2b00 时 ， 表 
示 MIPS32 架 构 。 





e AR 


GA A AT IAS (Architecture Revision) 字段 ， 当 其 值 为 
3'b000 时 ， 表 示 MIPS32/64 架 构 的 发 行 版 1， 当 其 值 为 3b001 时 ， 表 示 
MIPS32/64 架 构 的 发 行 版 2。 


e MT 


MMU 类 型 字段 ， 当 其 值 为 3b000 时 ， 表 示 没 有 MMU。OpenMIPS 处 
理 器 没有 实现 MMU， 所 以 本 字段 固定 为 3b000。 


e VI 


如 果 一 级 指令 缓存 是 使 用 虚拟 程序 地 址 索引 做 标签 ， 那 么 就 设置 本 
字段 为 1。OpenMIPS 处 理 嚣 没有 实现 缓存 ， 所 以 本 字段 固定 为 0。 


e KO 





表示 内 存 的 Kseg0 区 域 是 否 可 缓存 ， 其 中 Kseg0 是 内 存 中 的 一 段 空 
间 ， 读 者 不 用 了 解 具 体 细 节 ， 因 为 OpenMIPS 处 理 器 没有 实现 缓存 ， 所 
以 本 字段 固定 为 3b000。 


以 上 就 是 协 处 理 器 CP0 中 的 主要 寄存 器 ， 也 是 实现 OpenMIPS 处 理 
器 的 CP0 中 的 寄存 器 ， 读 者 可 能 会 有 疑问 ， 在 之 前 的 介绍 中 提 到 CP0 是 
用 来 系统 控制 的 ， 但 是 截止 到 现在 似乎 只 是 介绍 了 CP0 中 的 寄存 器 ， 那 
么 CP0 是 如 何 实现 系统 控制 功能 的 呢 ? 其 实 ，CP0 的 控制 功能 就 是 通过 
上 面 介 绍 的 寄存 器 实现 的 ， 比 如 : 状态 寄存 器 Status 中 的 中 断 手 但 字段 
IM， 处 理 器 要 依据 该 字段 处 理发 生 的 中 断 ， 通 过 修改 这 个 字段 ， 就 可 
以 控制 哪些 中 断 处 理 ， 哪 些 中 断 不 处 理 ， 这 就 体现 了 CP0 的 控制 功能 。 
中 断 处 理 的 详细 过 程 ， 会 在 第 11 章 介绍 。 


10.3” 协 处 理 器 CP0 的 实现 


要 实现 协 处 理 器 访问 指令 ， 首 先 要 实现 协 处 理 右 CP0， 其 实现 方式 

ae POR PHI, LOW eas i SCH sh. CPO O 40 110-150 

这 里 采用 左边 是 输入 接口 ， 右 边 是 输出 接口 的 方式 绘制 ， 这 样 比较 直 
观 ， 便 于 理解 。 各 接口 的 描述 如 表 10-11 所 示 。 























CP0 

—— wei data_o 上 一 

—— waddr i 
— data i count 0| 一 
compare_o 上 一 一 
一 一 int i status_ 0 一 一 
cause_0| 一 
— raddr_i cpc Oo 
config_o 上 一 一 
— rst prid_op—— 
clk timer_int_o| 一 一 

cp0_reg.v 


210-1 协 处 理 器 CP0 的 接口 图 


表 10-11 协 处 理 器 CP0 的 接口 描述 


EE (bit 
i 要 读 取 的 CPO 中 寄存 器 的 地 址 


int i HA 6 个 外 部 便 件 中 断 输入 
5 1 输入 是 否 要 写 CPO 中 的 寄存 器 


| 
fi 











me 
5 W. 5 输 


输入 /输出 
3 £ a 输出 
prid o 32 出 PRId 寄存 器 的 值 


16 timer int o | 1 | 是 否 有 定时 中 断 发 生 























协 处 理 堪 CP0 的 实现 代码 如 下 ， 源 文件 是 本 书 附带 光盘 
Code\Chapter10 目 录 下 的 cp0_reg.v 文 件 。 


module cpo_reg( 


input wire clk, 

input wire rst, 

input wire we_i, 
input wire[4:0] waddr_i, 
input wire[4:0] raddr_i, 


input wire[ 'RegBus] data_i, 























上 述 代 码 可 以 分 为 两 段 理 解 ， 第 一 段 实 现 了 对 CP0 中 寄存 器 的 写 操 
作 ， 依 据 写 入 地 址 ， 将 输入 数据 保存 到 不 同 的 寄存 器 中 ， 这 是 一 个 时 序 
逻辑 ， 第 二 段 实 现 了 对 CP0 中 hues 依据 读 取 地 址 ， 将 相应 
寄存 器 的 值 通过 data_o 接 口 输出 ， 这 是 一 个 组 合 逻 辑 。 注 意 以 下 几 点 。 








(1) OpenMIPS 只 实现 了 CP0 中 的 Count、Compare、Status、 
Cause, EPC, PRId, Config 7 个 寄存 右 


(2) 这 7 个 寄存 器 中 的 PRId4、Config 不 可 以 写 ， 所 以 在 第 一 段 代码 
中 没有 写 入 这 两 个 寄存 器 的 代码 。 此 外 ，Cause 寄 存 器 只 有 其 中 的 
IP[1:0]、IV、WP 三 个 字段 可 写 ， 所 以 对 Cause 寄 存 器 的 写 入 是 选择 性 
的 。 








(3) Count 寄 存 器 的 值 在 每 个 时 钟 周期 都 会 加 1。 


(4) 当 Compare 寄 存 器 不 为 0， A 
存 器 的 值 时 ， 将 输出 信号 timer_int_o 置 为 1， 表 示 时 钟 中 断 发 生 ， 这 个 中 
斯 会 一 直 声 明 ， 直 到 有 数据 写 入 Compare 寄 存 器 


(5) 当 写 Compare 寄 存 器 的 时 候 ， 会 将 输出 信号 timer_int_o 置 为 
0， 表 示 取 消 时 钟 中 断 的 声明 。 


(6) MIPS32 架 构 支 持 8 个 中 断 ， 但 是 有 2 个 是 软件 中 断 ， 支 持 的 外 
部 硬件 中 断 只 有 6 个 ， 所 以 CP0 模 块 的 中 断 输 入 信号 int_i 的 宽度 是 6。 





(7) Cause 寄 存 器 的 第 10 一 15bit 是 IP[7:2]， 也 就 是 外 部 硬件 中 断 挂 
起 字段 ， 指 明 外 部 硬件 中 断 是 否 挂 起 ， 所 以 代码 中 直接 将 外 部 中 断 输入 
int_j 赋 给 Cause 寄 存 喜 的 第 10 一 15bit。 


(8) CP0 中 寄存 堪 的 地 址 与 表 10-2 中 的 标号 是 一 致 的 。 


10.4 协 处 理 器 访问 指令 说 明 


要 实现 CP0 的 控制 功能 ， 需 要 对 CP0 中 的 有 关 寄 存 器 进行 设置 ， 这 





涉及 对 CP0 中 寄存 占 的 访问 ， 需 要 使 用 协 处 理 器 访问 指令 。 


MIPS32 指 令 





集 染 构 中 定义 了 2 条 协 处 理 絮 访问 指令 ; mtc0、mfc0， 前 者 实现 修改 
CP0 中 的 寄存 器 ， 后 者 实现 读 取 CP0 中 的 寄存 器 。 指 令 格式 如 图 10-2 所 
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COPO MT 
010000 00100 rt rd 00000000 sel 
COPO MF 

010000 00000 ri rd 00000000 sel 








图 10-2 mtc0、mfc0 指 令 格 式 





mtc0 指 令 


mfc0 指 令 


从 图 10-2 中 可 以 友 现 ， 这 2 条 指令 的 格式 与 之 前 已 实现 的 指令 都 不 





同 ， 主 要 特点 是 : 指令 码 都 为 6b010000，MIPS32 指 令 集 架构 定义 为 
COP0 类 ， 需 要 借助 于 第 21 一 25bit 的 值 才能 确定 具体 是 哪 一 条 指令 。 此 
外 ， 指 令 的 第 3 一 10bit 为 0， 第 0 一 2bit 是 sel 域 ， 这 个 域 的 作用 取决 于 有 具 
体 的 MIPS32 架 构 处 理 器 ， 对 OpenMIPS 处 理 器 而 言 ，sel 域 没有 作用 ， 不 
用 考虑 。 下 面 分 别 说 明 mtc0、mfc0 两 条 指令 的 用 法 、 作 用 。 





。 当 指 令 码 是 6b010000， 且 第 21 一 25bit 的 值 为 5b00100 时 ， 是 


mtc0 指 今 。 


站 令 用 法 为 : mtc0 rt, rd. 


指令 作用 为 : CPRIO, rd] <- GPR[rt]， 将 地 址 为 rt 的 通用 寄存 器 的 值 
赋 给 协 处 理 器 CP0 中 地 址 为 rd 的 寄存 器 。 


。 当 指 令 码 是 6b010000， 且 第 21 一 25bit 的 值 为 5b00000 时 ， 是 


mfc0 指 令 。 
指令 用 法 为 : mfc0 rt, rd. 


指令 作用 为 GPRI[rt] <- CPR[O, rd]， 读 出 协 处 理 器 CP0 中 地 址 为 rd 
的 寄存 器 的 值 ， 并 赋 给 地 址 为 rt 的 通用 寄存 器 。 


10.5” 协 处 理 器 访问 指令 实现 思路 


10.5.1 实现 思路 
与 对 HI、LO 寄 存 强 的 访问 一 样 ， 对 CP0 中 所 有 寄存 费 的 写 操作 也 都 


放 在 回 写 阶段 。 
1. mtc0 实 现 思 路 
(1) 在 译 码 阶段 依据 指令 ， 读 出 地 址 为 rt 的 通用 寄存 器 的 值 。 
(2) 在 执行 阶段 确定 要 写 入 CP0 中 寄存 器 的 值 ， 其 实 就 是 译 码 阶 
段 读 出 的 地 址 为 rt 的 通用 寄存 器 的 值 ， 将 这 些 信息 传递 到 访 存 阶 段 。 


(3) 访 存 阶段 再 将 这 些 信 息 传递 到 回 写 阶段 。 





(4) 回 写 阶段 依据 这 些 信 息 修 改 CP0 中 的 地 址 为 rd 的 寄存 器 。 


2. mfc0 实 现 思 路 
(1) 在 执行 阶段 获取 CP0 中 指定 寄存 器 的 值 ， 作 为 要 写 入 目的 通 





用 寄存 器 的 数据 ， 并 将 这 些 信息 传递 到 访 存 阶段 。 
2) 访 存 阶段 再 将 这 些 信 息 传递 到 回 写 阶段 。 
(3) 回 写 阶段 依据 这 些 信息 修改 地 址 为 rt 的 通用 寄存 器 。 


10.5.2 ”数据 流 图 的 修改 


添加 协 处 理 器 CP0 后 的 数据 流 图 如 图 10-3 所 示 。 相 比 图 9-29， 在 回 
写 阶段 增加 了 CP0 模 块 ， 并 且 CP0 模 块 的 输出 数据 传递 到 执行 阶段 ， 用 
于 确定 最 后 参与 运算 的 操作 数 。 比 如 : mfc0 指 令 在 执行 阶段 就 会 选择 从 
CP0 传 递 过 来 的 数据 ， 作 为 运算 结果 ， 写 入 目的 寄存 器 。 
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详 码 J: 执行 vite y B5, 


图 10-3 ”添加 协 处 理 器 CP0 后 的 数据 流 图 


10.5.3 ”系统 结构 的 修改 


为 了 实现 对 协 处 理 占 CP0 的 访问 指令 mtc0、mfc0， 需 要 对 系统 结构 
进行 如 图 10-4 所 示 的 修改 。 从 图 中 观察 ， 似 乎 增加 了 不 少 接口 ， 但 实际 
上 很 好 理解 。 








如 果 是 读 取 CP0 中 寄存 器 的 指令 mfc0， 那 么 在 执行 阶段 的 EX 模块 会 


通过 接口 cp0_reg_read_addr_o 输 出 要 读 取 的 CP0 中 寄存 器 的 地 址 ， 该 接 
口 直接 与 CP0 模 块 相连 ， 正 是 图 10-4 中 加 粗 的 连接 线 。CP0 模 块 通过 
data_o 接 口 送出 相应 的 数据 ， 送 出 的 数据 通过 EX 模块 的 接口 
cp0_reg_data_ i 进入 EX 模块 ， 正 是 图 10-4 中 加 粗 的 虚线 。 












































图 10-4 为 实现 协 处 理 器 访问 指令 而 对 系统 结构 做 的 修改 


如 果 是 修改 CP0 中 寄存 器 的 指令 mtc0， 那 么 会 在 执行 阶段 的 EX 模块 
通过 接口 cp0_reg_we_o 送 出 写 信 号 ， 通 过 接口 cp0_reg_write_addr_o 送 出 
要 写 的 CP0 中 寄存 器 的 地 址 ， 通 过 接口 cp0_reg_data_o 送 出 要 写 入 的 值 ， 
这 些 信息 最 终 都 传递 到 回 写 阶 段 ， 分 别 送 入 CP0 模 块 的 接口 we_i、 
waddr i、data_i， 从 而 达到 修改 CP0 中 指定 寄存 器 的 目的 。 


需要 特别 说 明 一 点 ， 对 于 读 取 CP0 中 寄存 器 的 指令 mfc0，EX 模 块 从 
CP0 模 块 中 读 取 的 值 可 能 不 是 最 新 的 值 ， 因 为 此 时 处 于 流水 线 访 存 、 回 
写 阶段 的 指令 可 能 是 mtc0， 也 就 是 说 可 能 会 修改 CP0 中 的 寄存 器 ， 读 者 
朋友 读 到 这 里 应 该 会 心 一 笑 ， 是 的 ， 这 个 问题 ， 在 第 4 章 考虑 流水 线 相 
关 的 时 候 遇 到 过 ， 在 第 6 章 读 / 写 HI、LO 寄 存 器 的 时 候 遇 到 过 ， 在 第 9 章 
读 / 写 LLbit 寄 存 器 的 时 候 也 遇 到 过 ， 解 决 方法 都 是 一 样 的 一 一 数据 前 
推 ， 此 处 也 不 例外 ， 将 访 存 、 回 写 阶段 对 CP0 中 寄存 器 的 写 信息 前 推 到 
执行 阶段 的 EX 模块 ， 由 EX 模块 判断 得 到 最 新 的 值 。 这 也 就 是 图 10-4 
中 ，MEM 模 块 、MEM/WB 模 块 的 输出 会 回 送 到 EX 模块 的 原因 。 











此 外 ， 图 10-4 中 ，CP0 模 块 的 各 个 寄存 器 输出 接口 暂时 没有 使 用 ， 
在 第 11 章 实现 异常 处 理 的 时 候 会 使 用 到 。 





还 需要 注意 的 是 ， 图 10-4 中 ，CP0 模 块 的 输入 int_i 是 OpenMIPS 处 理 
器 的 输入 ，CP0 模 块 的 输出 timer_int_o 是 OpenMIPS 处 理 器 的 输出 。 由 
此 ， 得 到 添加 协 处 理 器 CP0 后 的 OpenMIPS 处 理 器 接口 示意 图 如 图 10-5 所 
示 。 增 加 的 接口 如 表 10-12 所 示 。 


























OpenMIPS 

timer_int_o 
rst rom_ce o — 

clk rom_addr_o 
rom_data_i ram addr o 
ram_data_i ram_data_o 
int_i ram_sel_o 
ram We 0 
ram ce o 

openmips.v 


图 10-5 添加 协 处 理 器 CP0 后 的 0penMIPS 处 理 器 接口 图 


表 10-12 0penMIPS 处 理 器 新 增加 接口 的 描述 


e 号 | 接口 名 | me | maes | Ea | 








1 int i 6 输入 6 个 外 部 硬件 中 断 输入 
2 timer_int_o 1 输出 是 否 有 定时 中 断 发 生 


10.6 ”修改 OpenMIPS 以 实现 协 处 
SH ae Ui 148 4 


10.6.1 修改 译 码 阶段 


译 码 阶段 需要 修改 ID 模 块 ， 在 其 中 添加 对 mtc0、mfc0 指 令 的 译 码 。 
主要 修改 的 代码 如 下 所 示 ， 完 整 代 码 请 参考 本 书 附带 光盘 
Code\Chapter10 目 录 下 的 id.v 文 件 。 








reg1 addr o <= inst_i[20:16]; 
reg2_read_o <= 1'b0; 


end 


endmodule 





从 图 10-2 中 可 以 发 现 这 2 条 指令 的 格式 与 之 前 已 实现 的 指令 都 不 
同 ， 单 独 依据 指令 码 无 法 区 分 这 2 条 指令 ， 所 以 此 处 直接 通过 指令 第 21 
一 31bit 的 值 判 断 区 分 mfc0、mtc0 指 令 ， 另 外 ， 从 图 10-2 中 还 可 知 ， 这 2 
条 指令 要 求 第 0 一 10bit 都 为 0 (对 OpenMIPS 而 言 ， 其 中 se] 域 也 为 0) 。 





译 码 工作 主要 是 确定 要 写 的 目的 寄存 器 、 要 读 取 的 寄存 器 、 要 执行 
的 运算 等 三 个 方面 的 信息 。 以 下 分 别 解释 这 两 条 指令 的 译 码 工作 。 


(1) mfc0 指 令 


。 要 写 的 目的 寄存 器 : mfc0 指 令 需 要 将 读 取 的 CP0 中 寄存 器 的 值 
写 入 目的 寄存 器 ， 所 以 设置 wreg_o 为 WriteEnable， 同 时 ， 参 考 
图 10-2 可 知 ， 要 写 的 目的 寄存 器 是 指令 中 的 16-20bit， 正 是 指 

令 中 rt 的 值 ， 所 以 设置 wd_o 为 inst[20:16]。 

要 读 取 的 寄存 器 : mfc0 指 令 不 需要 读 取 通用 寄存 器 ， 所 以 设置 
regl_read_o、reg2_read_o 都 为 0。 

要 执行 的 运算 : 设置 alusel_ 0 为 EXE_RES_MOVE， 表 示 mfc0 指 
令 也 是 一 种 移动 运算 ， 设 置 aluop_o 为 EXE_MFC0_OP， 表 示 运 
算 子 类 型 是 mfc0。 


(2) mtc0 指 令 





要 写 的 目的 寄存 器 : mtc0 指 令 不 需要 写 通 用 寄存 器 ， 所 以 设置 
wreg_0 为 WriteDisable。 

要 读 取 的 寄存 器 : mtc0 指 令 需 要 读 取 通用 寄存 器 ， 所 以 设置 
regl_read_o 为 1， 表 示 通 过 Regfile 模 块 的 读 端 口 1 读 取 数 据 ， 读 
取 地 址 regl_addr_o 是 指令 中 的 第 16 一 20bit， 正 是 图 10-2 中 的 rt 
的 值 ， 所 以 最 终 译 码 阶段 的 输出 regl_o 就 是 地 址 为 rt 的 通用 寄 
TF A HJE o 

要 执行 的 运算 : 设置 alusel_0 为 EXE_RES_MOVE， 表 示 mtc0 指 
令 也 是 一 种 移动 运算 ， 设 置 aluop_o 为 EXE_MTC0_OP， 表 示 运 
算 子 类 型 是 mtc0。 


10.6.2 ”修改 执行 阶段 


1. 修改 EX 模块 


参考 图 10-4 可 知 ，EX 模 块 需要 增加 一 些 接 口 ， 新 增 接 口 的 描述 如 表 
10-13 所 示 。 


表 10-13 ”EX 模块 新 增加 接口 的 描述 


接口 名 Z (bi 输入 /输出 We ie 


从 CPO 模块 读 取 的 指定 寄存 器 的 





cp0 reg data i 输入 


访 存 阶 
的 寄存 器 
访 存 阶段 的 指令 要 写 的 CPO 中 寄 


= qn 


Falls 


mem cp0 reg we 





mem cp0 reg write addr 





访 存 B 
mem cp0 reg data papi persia 
了 器 的 数 
回 写 阶段 的 ] 


的 寄存 器 














回 写 阶 段 的 指令 要 写 的 CP0 HP ay 


app: 

















” 回 写 阶段 的 指令 要 写 入 CRO Hay 
7 wb_cp0 reg data 输入 exe we 
存 器 的 数 
kf 行 阶段 的 指令 要 读 取 的 CP0 中 
8 cp0 reg read addr o | Br ed 
9 0 1 丸 行 阶段 的 指令 是 否 要 写 CPO 中 
cp0_reg we o E SUSO 
0 ite add 行 阶段 的 指令 要 写 的 CPO 中 寄 
cp0 reg write addr o | 
0_reg_dat te \ 行 阶段 的 指令 要 写 入 CPO 中 寄 
cp0 reg data_o 3 a DE eye HF 
存 器 的 


EX 模块 的 代码 主要 修改 如 下 ， 完 整 代 码 请 参考 本 书 附带 光盘 中 
Code\Chapter10 目 录 下 的 ex.v 文 件 。 
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module ex( 


11 访 存 阶段 的 指令 是 否 要 写 CP9 中 的 寄存 器 ， 用 来 检测 数据 相关 
input wire mem_cp0_reg_we, 
input wire[4:0] mem_cp0_reg_write_addr, 


input wire[ 'RegBus] mem_cp0_reg_data, 

















cpO_reg_write_addr_o <= 5'b00000; 
cpo_reg_we_o <= ‘WriteDisable; 
cpo_reg_data_o <= "ZeroWord; 


end 


endmodule 








上 述 代码 可 以 分 为 三 段 理 解 。 前 两 段 与 nfc0 指 令 有 关 ， 最 后 一 段 与 
mtc0 指 令 有 关 。 


第 一 段 : 获得 CP0 中 指定 寄存 器 的 值 。 首 先 通 过 
cp0_reg_read_addr_ o 回 CP0 模 块 送 出 要 读 取 的 CP0 中 寄存 器 的 地 址 ， 从 
10.3 节 CP0 的 实现 代码 可 知 ， 读 取 操 作 是 组 合 馆 辑 ， 所 以 可 以 在 一 个 时 
钟 周期 内 给 出 相应 数据 ， 通 过 cp0_reg_data_i 接 口 送 入 EX 模块 ， 并 赋 给 
变量 moveres， 但 是 需要 注意 此 时 的 moveres 并 不 一 定 是 CP0 中 指定 寄存 
器 的 最 新 值 ， 还 要 判断 是 否 存 在 数据 相关 。 所 以 下 面 接着 判断 访 存 阶段 
的 指令 是 否 要 写 CP0 中 的 寄存 器 ， 而 且 要 写 的 是 同一 个 寄存 器 ， 如 果 
是 ， 那 么 将 访 存 阶 段 要 写 入 的 值 ， 作 为 CP0 中 指定 寄存 器 的 最 新 值 ， 反 
之 ， 继 续 判 断 回 写 阶段 的 指令 是 否 要 写 CP0， 而 且 要 写 的 是 同一 个 寄存 
器 ， 如 果 是 ， 那 么 将 回 写 阶段 要 写 入 的 值 ， 作 为 CP0 中 指定 寄存 器 的 最 
新 值 。 




















第 二 段 : 依据 指令 的 运算 类 型 ， 确 定 最 终 要 写 入 目的 寄存 器 的 值 ， 
由 于 之 前 在 译 码 阶段 ， 将 指令 mfc0 的 运算 类 型 设置 为 
EXE_RES_MOVE， 所 以 会 将 moveres 的 值 作为 要 写 入 目的 寄存 器 的 值 ， 
此 处 的 moveres 是 在 第 一 段 代 码 中 获取 的 。 





第 三 段 : 如 果 是 mtc0 指 令 ， 那 么 给 出 对 CP0 中 寄存 堪 的 写 信息 : + 
置 写 操作 信号 cp0_reg_we_o 为 WriteEnable、 写 入 地 址 为 指令 中 第 11 一 
15bit 的 值 、 写 入 的 值 就 是 译 码 阶段 传递 过 来 的 reg1_i 的 值 ， 参 考 10.6.1 节 
译 码 阶段 可 知 ， 访 值 正 是 地 址 为 rt 的 通用 寄存 器 的 值 。 


2. 修改 EXMEM 模 块 





EX/MEM 模 块 会 将 EX 模块 得 到 的 对 CP0 中 寄存 器 的 写 信 息 向 流水 线 
一 级 传递 ， 参 考 图 10-4 可 知 ，EX/MEM 增 加 了 部 分 接口 ， 新 增 接口 的 
Da 如 表 10-14 所 示 。 


表 10-14 EX/MEM 模 块 新 增 接 口 的 描述 





ae (bit) | ENT 
执行 阶段 的 指令 是 否 要 写 CPO 中 的 
1 ex_cp0 reg we 输入 Sg 


ae coin | 输入 输出 


WA 行 阶段 的 指令 要 写 的 CPO 中 寄存 
输 een 
TE ~ 


2 ex cp0 reg write addr 





在 阶段 的 指令 要 写 的 CPO 中 寄存 


mem cp0 reg write addr 




















阶段 的 指令 要 写 入 CPO 中 寄存 











mem cp0 reg data 





行 阶段 的 指令 要 写 入 CPO 中 寄存 
3 ex cp0 reg data MA Ra 
fiir alii 
E ASI» EL Wy te A EL AS BT ro tt 
D I 指令 是 否 要 写 CPO 中 的 
4 mem cp0 reg we Mili SB 
OR EA] 
5 mh 
BR 1144, la 
sir ll 
6 ‘tL a 
a = 


EX/MEM 模 块 的 代码 主要 修改 如 下 。 完 整 代码 可 以 参考 本 书 附带 光 
中 Code\Chapter10 目 录 下 的 ex_mem.v 文 件 。 


module ex_mem( 








10.6.3 ”修改 访 存 阶 段 


1. 修改 MEM 模 块 


MEM 模 块 会 将 执行 阶段 传递 过 来 的 ， 对 CP0 中 寄存 器 的 写 信息 继续 
传递 到 流水 线 下 一 级 ， 参 考 图 10-4 可 知 ，MEM 模 块 增加 了 部 分 接口 ， 
新 增 接口 的 作用 如 表 10-15 所 示 。 


表 10-15 MEM 模 块 新 增 接口 的 描述 


访 存 阶 段 的 指令 要 写 的 CP0 中 寄 
i cp0 reg write addr i | 5 输入 存 器 的 地 址 
访 存 阶段 的 指令 要 写 入 CPO 中 寄 
data i A 
= a ail AM |e 2 (es 








ee ke h 1 输出 访 存 阶段 的 指令 最 终 要 写 

TO Cp0 中 的 寄存 器 
访 存 阶段 的 指令 最 终 要 写 的 CP0 

cp0 reg write addr o | 5 输出 ASEO 
‘ 访 存 阶段 的 指令 最 终 要 写 入 CPO 

cp0 reg data o 32 输出 PEPENE 


MEM 模 块 的 代码 主要 修改 如 下 ， 只 是 简单 地 将 对 CP0 中 寄存 器 的 写 
言 息 传 递 到 流水 线 下 一 级 。 完 整 代码 可 以 参考 本 书 光 盘 中 
Code\Chapter10 目 录 下 的 mem.v 文 件 。 














修改 MEM/WB 模 块 





MEM/WB 模 块 会 将 MEM 模 块 传递 过 来 的 ， 对 CP0 中 寄存 器 的 写 信 
息 传递 到 回 写 阶 段 ， 参 考 图 10-4 可 知 ，MEM/WB 模 块 增加 了 部 分 接口 ， 
新 增 接口 的 作用 如 表 10-16 所 示 。 


表 10-16 MEM/AWB 模 块 新 增 的 接口 描述 


ana m cot) | 输入 输出 


En 访 存 阶段 的 指令 是 否 要 写 CPO 
mem cp0 reg we il X 
中 的 寄存 器 


访 存 阶段 的 指令 要 写 的 CP0 中 
z a HAL 


m 
U 
poll 阶段 的 指令 要 写 入 CPO 中 
3 mem cp0 reg data 32 1 Rn He 
寄存 器 的 数据 
续 表 


mem cp0 reg write addr 





j ll 
fi 可 写 阶 段 的 指令 是 否 要 写 CP0 
4 wb_cp0 reg we = | 
的 寄存 器 


可 写 阶段 的 指令 要 写 的 CP0 中 
寄存 器 的 地 址 
可 写 阶 段 的 指令 要 写 入 CPO 中 
寄存 器 的 数据 


wb_cp0 reg write addr 





wb cp0 reg data 











MEM/WB 模 块 的 代码 主要 修改 如 下 。 完 整 代 码 可 以 参考 本 书 附带 
光盘 中 Code\Chapter10 目 录 下 的 mem_wb.v 文 件 。 


module mem_wb ( 


input wire mem_cp0_reg_we, 
input wire[4:0] mem_cp0_reg_write_addr, 


input wire[ RegBus] mem_cp0_reg_data, 








10.6.4 ”修改 OpenMIPS 模 块 


因为 修改 了 一 些 模块 的 接口 ， 所 以 需要 修改 OpenMIPS 模 块 ， 按 照 
图 10-4 所 示 ， 将 新 增加 的 接口 连接 在 一 起 。 需 要 注意 一 点 ，OpenMIPS 
模块 本 身 也 增加 了 两 个 接口 : int_i、timer_int o。 上 有 具体 代码 不 在 书 中 给 
出 ， 读 者 可 以 参考 本 书 光 附带 光盘 Code\Chapter10 目 录 下 的 openmips.v 文 
[Fa 


10.7 Winter 


为 了 验证 本 章 添加 的 协 处 理 器 CP0， 以 及 协 处 理 器 访问 指令 mfc0、 
mtc0 是 否 实现 正确 ， 编 号 测试 程序 如 下 ， 源 文件 是 本 书 附 带 光 盘 中 
Code\Chapter10\AsmTest 目 录 下 的 inst_rom.S 文 件 。 





程序 首先 写 Compare 寄 存 器 ， 使 其 值 等 于 0xf。 这 样 ， 第 15 个 时 钟 周 
期 ，Count 寄 存 器 的 值 等 于 Compare 寄 存 器 的 值 ， 会 输出 时 钟 中 断 


(timer_int_oW1) 。 程 序 接着 将 0x10000401 写 入 Status 寄 存 器 ， 然 后 读 
出 Status 寄 存 器 的 值 ， 保 存 到 寄存 器 $2， 用 以 验证 读 出 、 写 入 CP0 中 寄存 
器 是 否 正 确 。ModelSim 仿 真 效 果 如 图 10-6 所 示 ， 从 中 可 知 OpenMIPS 正 
确实 现 了 协 处 理 器 CP0， 以 及 协 处 理 圳 访问 指令 mfc0、mtc0。 


E | 


de rst sto | 

® dk Y Aaa aa 
4% «p0_regO/count_o 000... 0000000 1}00000002}00000003}00000004}00000005}00000006 1 
2% 中 0_reg0/jcompare 000... 
























































lx timer_int_o 0 
5-4 中 0_reg0jstatus o 100... 
5-4 reofilet/regs[1] 100... 

® rst sto 

de ck sti 
如 人 中 0_reg0jcount o 000... 
2-44 cp0_regd/compare_o 000... 

ls timer_int_o 1 
4 cp0_regd/status_o 100... 
5-4 regfile1/regs[1] 100... 
1-4 regfile1/regs[2] 100... 一 一 (10000401 








(3) Status 寄 存 器 的 值 被 设置 为 0x10000401 


a | 
(4) mfe0 指 令 读 取 Status 寄 存 器 的 值 ， 读 出 的 数据 保存 到 寄存 器 $2， 正 是 0x10000401 | 


FUE ARMA SS 


本 章 是 实现 教学 版 OpenMIPS 处 理 器 的 最 后 一 步 ， 将 实现 异常 相关 
指令 。 首 先 在 11.1 节 介绍 MIPS32 架 构 中 定义 的 异常 类 型 ， 明 确 了 
OpenMIPS 处 理 器 能 够 处 理 的 其 中 几 种 异常 类 型 。 随 后 在 11.2 节 解释 精 
确 异 常 的 概念 ，OpenMIPS 处 理 器 能 够 做 到 精确 异常 。11.3 节 介绍 
OpenMIPS 处 理 器 的 异常 处 理 过 程 ， 这 个 过 程 与 MIPS32 架 构 定义 的 异常 
处 理 过 程 稍 微 有 些 区 别 ， 为 的 是 简单 ， 易 于 理解 。 然 后 在 11.4 节 对 异常 
相关 指令 给 出 了 说 明 ， 包 括 自 陷 指 令 、 系 统 调 用 指令 syscall、 异 常 返回 
指令 eret 等 。11.5 节 说 明 异 常 相关 指令 的 实现 思路 ， 以 及 为 了 实现 异常 
相关 指令 而 对 数据 流 图 、 系 统 结构 作 的 修改 。11.6 节 通过 修改 
OpenMIPS 的 代码 实现 异常 相关 指令 。11.7 节 再 次 修改 了 最 小 SOPC， 将 
时 钟 中 断 输出 接口 与 其 中 一 个 中 断 输入 接口 相连 ， 这 样 OpenMIPS 就 可 
以 响应 时 钟 中 断 异 常 了 。11.8 节 编写 了 3 个 测试 程序 ， 用 于 验证 异常 相 
关 指 令 是 否 实现 正确 。 
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11.1 MIPS322E% Fe MARA 
型 


在 MIPS32 架 构 中 ， 有 一 些 事 件 要 打 断 程序 的 正音 执行 流程 ， 这 些 
事件 有 中 断 〈Interrupt) ~ bat (Trap) 、 系 统 调 用 〈System Call) 以 
及 其 他 任何 可 以 打 断 程序 正常 执行 流程 的 情况 ， 统 称 为 异常 。 异 弟 类 型 
及 其 优先 级 如 表 11-1 所 示 。 读 者 朋友 如 果 没 有 时 间 ， 可 以 只 理解 其 中 使 
用 灰色 背景 标注 的 异常 ，OpenMIPS 处 理 器 也 只 实现 了 对 这 些 异常 的 响 
应 处 理 。 











表 11-1 MIPS32 架 构 中 定义 的 异常 类 型 及 其 优先 级 


aaa = io 8 


Soft Reset u 
位 ， 是 软 复 位 


COM ea 
COMO emaa EXIT 


发 生 在 8 个 中 断 之 一 被 检测 到 
7 Interrupt 时 ， 包 括 6 个 外 部 硬件 中 断 、2 个 
软件 中 断 








LEE 
Deferred Watch EMMA RES 


Debug Hardware Instruction Break 
DIB Match， 指 令 人 硬件 晰 点 和 正在 执 
行 的 指令 相符 合 
与 观测 寄存 器 中 尽 


”| Error 取 指 地 
| 
TLBL 





mein 


= [es Fetch Bus — 
总 \ 线 错误 VW 


Bee ond 
ME 


PEA AMA AT 





况 下 ， 执 行 了 协 处 理 器 指令 
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— E 


算术 操作 指令 add、addi、sub 运 
_—— 


mo Jurr 目 陷 指令 


Data Address Break or Data Value 
DDBL/DDBS Break on Store 存 储 过 程 中 ， 数 据 

地 址 断 点 或 数据 值 断 点 

T [A 


— BN AdEL naa 的 地 址 未 对 章 
A 的 地 址 未 对 齐 


| 
E a a msa 
nvalid 


>p 对 不 可 写 | 对 不 可 写 的 TLB 进 行 了 写 操作 — 写 操作 


Data Hardware Breakpoint 
DDBL matched in load data compare JJ] £% 
aan 


OpenMIPS 处 理 器 只 实现 对 其 中 6 种 异常 情况 的 处 理 ， 列 举 如 下 : 











e 便 件 复位 ; 

e 中断 (包含 软 中 断 、 硬 中 断 )〉; 
e syscall 系 统 调用 ; 

。 无 效 指令 ; 

e ih; 


。 目 陷 指令 引发 的 异 第 。 





异常 发 生 后 ， 会 进入 寞 第 处 理 例 程 进行 具体 的 异常 处 理 ， 处 理 结束 
后 ， 返 回 到 异常 发 生前 的 状态 继续 执行 。 在 上 面 的 6 种 异常 中 ， 硬 件 复 
位 是 一 种 特殊 的 异常 ， 特 殊 之 处 在 于 不 用 从 异常 处 理 例 程 返 回 ， 所 以 不 
用 考虑 保护 现场 ， 也 不 用 保存 返回 地 址 ，OpenMIPS 对 硬件 复位 寞 常 的 
处 理 方法 是 很 简单 的 : 全 部 寄存 器 清 零 ， 从 地 址 0x0 处 取 指 执行 ， 这 实 
际 也 就 是 复位 的 过 程 。 所 以 便 件 复位 异常 的 处 理 过 程 不 再 论述 ， 本 章 只 
论述 其 余 5 种 异 第 的 处 理 过 程 。 





11.2 Kirn 





在 MIPS 的 文档 中 经 常会 读 到 “精确 异常 ?这 个 术语 ，OpenMIPS 的 实 
现 蓝 图 中 也 设计 为 实现 精确 异常 ， 本 节 将 介绍 精确 异常 的 相关 概念 。 


当 一 个 异常 发 生 后 ， 系 统 的 顺序 执行 会 被 中 断 ， 此 时 有 奉 干 条 指令 
处 于 流水线 上 的 不 同 阶 段 ， 处 理 器 会 转移 到 寞 常 处 理 例 程 ， 异 常 处 理 结 
束 后 返回 原 程 序 继续 执行 ， 因 为 不 希望 异常 处 理 例 程 破坏 原 程 序 的 正常 
执行 ， 所 以 对 于 异常 发 生 时 ， 流 水 线 上 没有 执行 完 的 指令 ， 必 须 记 住 它 
处 于 流水 线 的 哪 一 个 阶段 ， 以 便 录 稼 处 理 结束 后 能 恢复 执行 ， 这 便 是 精 
WFR FE o 














对 于 一 个 实现 精确 异常 的 处 理 器 ， 在 异常 发 生 时 ， 都 会 有 一 个 被 异 
mI MTGE, PAR SCH A (Exception Victim) ， 也 可 称 为 发 生 异 
第 的 指令 ， 该 指令 前 面 的 所 有 指令 都 要 被 执行 到 流水 线 的 最 后 一 个 阶 
段 ， 也 残 是 正常 执行 完成 ， 但 是 该 指令 及 该 指令 之 后 的 指令 都 要 被 取 
消 ， 束 像 从 来 没有 执行 过 一 样 。 如 图 11-1 所 示 。 第 2 条 指令 add 在 执行 阶 
段 发 生 浇 出 异常 ， 在 这 种 情况 下 ， 已 经 到 达 访 存 阶段 的 第 1 条 指令 ori 会 
继续 执行 完成 ， 而 第 2、3、4 条 指令 都 会 被 取消 ， 不 会 有 任何 影响 处 理 
器 的 情况 有 发生， 就 像 没有 进 过 流水 线 一 样 。 














1 oi $1,80,0x1100 an x PIB > Aus >< 访 存 x 加 号 > 














2 add $1,$5,$10 性 取 指 X RO 回 写 > 
3 andi $3,$1,0x400 <m <A A Hr >< AE > 
4 subi $4,$1,0x004 取 指 > > > ls > 


| 溢出 


图 11-1 精确 异常 示例 





MS E BIERE E A E IUE FS IAH E , 
在 非 流 水 线 的 处 理 器 上 ， 这 一 点 是 显然 的 ， 但 是 对 于 拥有 流水 线 的 处 理 
器 ， 就 会 有 些 复杂 。 在 流水 线 处 理 器 上 ， 异 常会 在 流水 线 的 不 同 阶段 发 
生 ， 带 来 潜在 的 问题 。 比 如 : 以 图 11-2 为 例 ， 加 载 指令 ]w 会 在 流水 线 的 
访 存 阶段 发 生地 址 未 对 齐 的 异常 《因为 加 载 地 址 是 0x3， 指 令 Iw 要 求 加 
载 地 址 的 最 后 两 位 为 00〉， 该 异常 应 该 会 在 第 4 个 时 钟 周期 友 生 ， 而 它 
的 后 一 条 指令 di 是 无 效 指令 (MIPS32 架 构 并 没有 定义 该 指令 ， 所 以 是 无 
效 指令 ) ， 会 在 流水 线 的 译 码 阶段 引发 无 效 指令 异常 ， 也 就 是 在 第 3 个 
时 钟 周期 ， 而 此 时 上 一 条 加 载 指令 lw 还 处 于 执行 阶段 ， 没 有 进入 访 存 阶 
Bo JUE EIA LEA LAA MAAE ALEA) 
与 指令 的 顺序 相同 这 一 要 求 。 


地 址 未 对 齐 异 常 | 
| H Ñ 3 \ ae E E 
1 1w $1,x3($0) G IDADE 可 
2 di$1,$5,$1 DERE De 














图 11-2 在 流水 线 处 理 器 中 ， 异 常 发 生 的 顺序 与 指令 的 顺序 不 一 定 相同 


为 了 避免 上 述 情况 ， 先 发 生 的 弄 常 并 不 立即 处 理 ， 和 异常 事件 只 是 被 
标记 ， 并 继续 运行 流水 线 。 在 大 多 数 处 理 右 中 ， 和 
线 阶段 ， 专 门 用 于 处 理 异 常 。 如 果 某 一 条 指令 的 异常 事件 到 达 了 流水 线 
的 这 个 阶段 ， 那 么 会 进行 异常 处 理 ， 并 且 当 前 处 于 流水 线 其 余 阶 段 的 指 
SI 被 忽略 。 还 是 以 图 11-2 为 例 ， 假 设 处 理 费 会 在 访 存 阶 
段 处 理 异常 情况 ， 那 么 dj 指令 虽然 在 第 3 个 时 钟 周期 发 生 了 异常 ， 但 是 
并 不 处 理 ， 只 是 保存 一 个 蜡 常 标记 ， 等 到 第 5 个 时 钟 周期 该 指令 进入 访 
存 阶段 时 再 处 理 。 但 是 ， 在 第 4 个 时 钟 周期 ， 上 一 条 指令 lw 进入 了 访 存 
阶段 ， 并 且 发 生 了 地 址 未 对 齐 异常 ， 因 为 已 经 处 于 访 存 阶段 了 ， 所 以 会 
处 理 该 异常 ， 而 包括 无 效 指令 异常 在 内 的 流水 线 其 余 阶段 的 异常 都 被 忽 
HR © 





通过 以 上 方法 就 可 以 在 流水 线 处 理 器 中 实现 “ 按 指 令 执 行 的 顺序 处 
理 异 第 ， 而 不 是 按 寞 常用 生 的 顺序 处 理 异常 处 理 ”。 
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当 检 测 到 异常 发 生 后 ， 人 处 理 右 会 执行 一 系列 动作 以 处 理 异常 ， 不 同 
处 理 器 的 处 理 过程 也 不 同 ，OpenMIPS 处 理 器 的 处 理 过 程 如 下 。 


(1) 检测 CP0 中 Status 寄 存 右 的 EXL 字 段 ， 分 两 种 情况 。 








e 如 果 EXL 为 1， 表 示 当 前 已 经 处 于 异常 处 理 过 程 中 了 ， 此 时 ， 
如 有 果 当 前 发 生 的 异常 类 型 是 中 断 ， 那 么 不 处 理 ， 忽 略 该 异常 ， 
因为 在 异常 处 理 过 程 中 会 禁止 中 断 。 如 果 当 前 发 生 的 异常 类 型 
不 是 中 汤 ， 那 么 将 异常 原因 保存 到 CP0 中 Cause 寄 和 存 器 的 
ExcCode 字 段 ， 转 到 步骤 (4) 。 

如 果 EXL 为 0， 那 么 将 异常 原因 保存 到 CP0 中 Cause 寄 存 右 有 的 
ExcCode 字 段 ， 进 入 步骤 O) o 





(2) 检查 发 生 异 常 的 指令 是 否 在 延迟 槽 中 ， 如 果 在 延迟 槽 中 ， 那 
么 设置 EPC 寄 存 器 的 值 为 该 指令 的 地 址 减 4， 同 时 设置 Cause 寄 存 器 的 BD 
字段 为 1， 反 之 ， 设 置 EPC 寄 存 右 的 值 就 为 该 指令 的 地 址 ， 同 时 设置 
Cause 寄 存 器 的 BD 字 段 为 0。 





(3) 设置 Status 寄 存 器 的 EXL 字 段 为 1， 表 示 进 入 异 第 处 理 过 程 ， 
茶 止 中 断 。 


(4) 处 理 器 转移 到 事先 定义 好 的 一 个 地 址 ， 在 那个 地 址 中 往往 有 
异常 处 理 例 程 ， 在 其 中 进行 异常 处 理 ， 这 个 地 址 称 为 异常 处 理 例 程 入 口 
地 址 。OpenMIPS 定 义 的 异常 处 理 例 程 入 口 地 址 如 表 11-2 所 示 。 此 处 对 
系统 调用 、 无 效 指令 、 注 出 、 自 陶 这 四 类 异常 都 设置 为 相同 的 处 理 例 程 








入 口 地 址 ， 当 然 也 可 以 设置 为 不 同 的 地 址 ， 读 者 在 阅读 完 本 章 后 ， 将 学 
会 如 何 根据 情况 自行 修改 。 





以 上 就 是 OpenMIPS 处 理 器 在 检测 到 异常 发 生 后 的 处 理 过 程 ， 可 以 
使 用 图 11-3 描 述 。 熟 悉 MIPS32 架 构 中 异常 处 理 过 程 的 读者 可 能 会 注意 到 
上 述 过 程 与 MIPS32 架 构 中 的 异常 处 理 过 程 只 有 一 点 不 同 ， 那 就 是 对 异 
常 处 理 例 程 入 口 地 址 的 规定 不 同 。OpenMIPS 处 理 器 由 于 没有 MMU， 所 
以 将 异常 处 理 例 程 入 口 地 址 都 放 在 低地 址 空间 。 
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图 11-3 ”0penMIPS 处 理 器 的 异常 处 理 过 程 


在 异常 处 理 例 程 中 会 进行 具体 的 异常 处 理 ， 处 理 结束 后 ， 需 要 返回 
到 异常 发 生前 的 状态 继续 执行 。MIPS32 指 令 集 提供 了 异常 返回 指令 eret 
来 完成 此 项 工作 。eret 指 令 既 要 清除 Status 寄 存 器 的 EXL 字 段 ， 从 而 使 能 


中 断 ， 还 要 将 EPC 寄 存 器 保存 的 地 址 恢复 到 PC 中 ， 从 而 返回 到 异常 发 生 
处 继续 执行 。 


表 11-2 0penMIPS 处 理 器 定义 的 异常 处 理 例 程 入 口 地 址 





处 理 例 程 地 引起 异常 的 条 件 


FAT CInterrupt ) 0x20 REF ER eK EB ST 


执行 了 系统 调用 指令 syscall 


BW O \ 文 持 的 
ES 


系统 调用 Sys 0x40 


0x40 


| 


算术 操作 指令 add、addi、sub 运 


Y LH Ov 0x40 


yin HH 


0x40 执行 了 自 陷 指令 


读者 可 能 会 注意 到 这 个 问题 : 如 果 发 生 异 背 的 指令 在 延迟 槽 中 ， 那 
么 保存 到 寄存 器 EPC 的 值 是 PC-4， 如 果 发 生 异 常 的 指令 不 在 延迟 槽 中 ， 
那么 保存 到 寄存 器 EPC 的 值 是 PC， 为 何 会 有 这 种 区 别 呢 ? 





— 


并 
Bi 


IX EAA TE S| A KERNE ZA, E TE 
转移 指令 -> 转移 目标 地 址 的 指令 
引入 延迟 槽 之 后 ， 处 理 需 执行 转移 指令 的 顺序 是 


转移 指令 -> 延迟 槽 指令 -> 转移 目标 地 址 的 指令 


在 中 间 插 入 了 延迟 槽 指令 ， 当 延迟 槽 中 的 指令 发 生 异 党 时 ， 如 宁 在 
寄存 器 EPC 中 保存 延迟 槽 指令 的 地 址 ， 那 么 从 异常 处 理 例 程 返回 时 ， 将 
回 到 延迟 槽 指令 的 地 址 处 ， 重 新 执行 的 指令 顺序 将 是 。 





延迟 槽 指令 -> 延迟 槽 指令 的 下 一 条 指令 


可 见 没 有 发 生 转移 ， 这 样 就 不 是 被 打 断 之 前 的 指令 顺序 ， 所 以 ， 为 
了 恢复 原来 的 指令 顺序 ， 在 这 里 将 延迟 槽 之 前 的 转移 指令 的 地 址 保存 到 
寄存 器 EPC 中 ， 也 就 是 PC-4。 





11.4 异 第 相关 指令 介绍 


MIPS32 指 令 集 架构 中 定义 的 异常 相关 指令 包括 : 目 陷 指令 、 系 统 


调用 指令 syscall、 异 常 返回 指令 eret， 下 面 分 别 介 绍 。 


11.41 HRS 





目 陷 指令 有 12 条 ， 按 照 指 令 中 是 否 包 含 立 即 数 ， 可 以 分 为 两 类 。 
1. 不 包含 立即 数 的 目 陷 指令 


不 包含 立即 数 的 自 陷 指令 有 6 条 ， 指 令 格式 如 图 11-4 所 示 。 
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000000 i i code 110100 teq 指 全 
SPECIAL TGE ta 
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SPECIAL | TLT Em 
000000 m ia sode 110010 tjie 
SPECIAL | TLTU N 
000000 TS rt code 110011 ttu 指 邻 
SPECIAL TNE ei 
000000 = m ande 110110 me 指令 























图 11-4 不 包含 立即 数 的 自 陷 指令 


从 图 11-4 中 可 知 ， 这 6 条 上 自 陷 指令 都 是 R 类 型 指令 ， 且 指令 码 都 是 
SPECIAL， 可 以 依据 第 0 一 5bit 功 能 码 的 值 确定 是 哪 一 种 指令 。 另 外 ， 指 


令 的 第 6 一 15bit 都 是 code 字 段 ， 该 字段 在 译 码 过 程 中 没有 作用 ， 被 忽略 
掉 ， 但 是 软件 可 以 利用 这 个 字段 保存 一 些 信息 。 


。 当 功 能 码 为 6b110100 时 ， 是 teq 指 令 。 
指令 用 法 为 : teq rs, rt. 


HO VERA: if GPR[rs] = GPR[rt] then trap， 将 地 址 为 rs 的 通用 寄存 
器 的 值 ， 与 地 址 为 rt 的 通用 寄存 器 的 值 进 行 比 较 ， 如 果 两 者 相等 ， 那 么 
引发 自 陷 异常 。 


e 当 功 能 码 为 6b110000 时 ， 是 tge 指 令 。 
站 令 用 法 为 : tge rs, rt. 


指令 作用 为 :if GPR[rs] > GPR[rt] then trap， 将 地 址 为 rs 的 通用 寄存 
器 的 值 ， 与 地 址 为 rt 的 通用 寄存 堪 的 值 作 为 有 符号 数 进行 比较 ， 如 果 前 
者 大 于 等 于 后 者 ， 那 么 引发 目 陷 异常 。 


。 当 功 能 码 为 6b110001 时 ， 是 tgeu 指 令 。 
日 令 用 法 为 : tgeu rs, rt. 


指令 作用 为 : if GPR[rs] > GPR[rt] then trap， 将 地 址 为 rs 的 通用 寄存 
器 的 值 ， 与 地 址 为 rt 的 通用 寄存 堪 的 值 作为 无 符号 数 进行 比较 ， 如 果 前 
者 大 于 等 于 后 者 ， 那 么 引发 目 陷 异常。 





e 当 功 能 码 为 6b110010 时 ， 是 tt 指令 。 


指令 用 法 为 : tlt rs, rt. 


指令 作用 为 : if GPR[rs] < GPR[rt] then trap， 将 地 址 为 rs 的 通用 寄存 
器 的 值 ， 与 地 址 为 rt 的 通用 寄存 器 的 值 作 为 有 符号 数 进行 比较 ， 如 果 前 
者 小 于 后 者 ， 那 么 引发 自 陷 异常 。 


e 当 功 能 码 为 6b110011 时 ， 是 tltu 指 令 。 
指令 用 法 为 : tltu rs, rt。 


站 令 作用 为 : if GPR[rs] < GPR[rt] then trap， 将 地 址 为 rs 的 通用 寄存 
器 的 值 ， 与 地 址 为 rt 的 通用 寄存 器 的 值 作为 无 符号 数 进行 比较 ， 如 果 前 
者 小 于 后 者 ， 那 么 引发 自 陷 异常。 


e 当 功 能 码 为 6b110110 时 ， 是 tne 指 令 。 
指令 用 法 为 : tne rs, rt。 


日 令 作 用 为 : if GPR[rs] 4 GPR[rt] then trap， 将 地 址 为 rs 的 通用 寄存 
器 的 值 ， 与 地 址 为 rt 的 通用 寄存 器 的 值 进行 比较 ， 如 果 两 者 不 相等 ， 那 
么 引发 自 陷 异常 。 


2. 包含 立即 数 的 目 陷 指令 


含 立 即 数 的 目 陷 指令 也 有 6 条 ， 指 令 格式 如 图 11-5 所 示 。 












































31 26 25 21 20 16 15 
REGIMM rs TEQI immediate 
000001 01100 
REGIMM m TGEI inmediate 
000001 01000 
REGIMM TGEIU A diat 
000001 rs 01 001 Immediate 
REGIMM $ TLTI A ediat 
000001 A 01010 RS 
REGIMM rs TLTIU immediate 
000001 01011 
REGIMM si TNEI immediate 
000001 01110 
2115 包含 立即 数 的 自 陷 指令 


teqi 指 令 
tgei 指 今 
tgeiu 指 今 
tlti 指 令 
tltiu 指 令 


tnei 指 令 


从 图 11-5 可 知 ， 这 6 条 上 自 陷 指令 都 是 I 类 型 指令 ， 且 指令 码 都 是 
REGIMM， 可 以 依据 第 16 一 20bit 的 值 确定 是 哪 一 种 指令 。 这 6 条 目 陷 指 





令 与 之 前 不 包含 立即 数 的 6 条 自 陷 指令 的 区 别 在 于 ， 此 处 的 自 陷 判断 条 





件 不 再 是 两 个 寄存 器 的 比较 结果 ， 而 是 一 个 寄存 需 与 指令 中 立即 数 的 比 


较 结果 。 


e 当 第 16 一 20bit 的 值 为 5b01100 时 ， 表 示 是 teqi 指 令 。 


指令 用 法 为 : teqi rs, immediate。 


指令 作用 为 : if GPR[rs] = sign_extended(immediate) then trap， 将 地 
址 为 rs 的 通用 寄存 器 的 值 ， 与 指令 中 16 位 立即 数 符号 扩展 至 32 位 后 的 值 
进行 比较 ， 如 果 两 者 相等 ， 那 么 引发 自 陷 异常。 


。 当 第 16 一 20bit 的 值 为 5b01000 时 ， 表 示 是 tgei 指 令 。 


中 令 用 法 为 : tgei rs, immediate. 


指令 作用 为 : if GPR[rs] > sign_extended(immediate) then trap， 将 地 
址 为 rs 的 通用 寄存 器 的 值 ， 与 指令 中 16 位 立即 数 符号 扩展 至 32 位 后 的 值 
作为 有 符号 数 进行 比较 ， 如 果 前 者 大 于 等 于 后 者 ， 那 么 引发 自 陷 异常 。 


。 当 第 16 一 20bit 的 值 为 5b01001 时 ， 表 示 是 tgeiu 指 令 。 
旨 令 用 法 为 : tgeiu rs, immediate. 


指令 作用 为 : if GPR[rs] > sign_extended(immediate) then trap， 将 地 
址 为 rs 的 通用 寄存 器 的 值 ， 与 指令 中 16 位 立即 数 符号 扩展 至 32 位 后 的 值 
作为 无 符号 数 进行 比较 ， 如 果 前 者 大 于 等 于 后 者 ， 那 么 引发 自 陷 异常 。 


e 当 16-20bit 的 值 为 5b01010 时 ， 表 示 是 tti 指 令 。 
指令 用 法 为 : tlti rs, immediate. 


站 令 作 用 为 : if GPR[rs] < sign_extended(immediate) then trap， 将 地 
址 为 rs 的 通用 寄存 器 的 值 ， 与 指令 中 16 位 立即 数 符号 扩展 至 32 位 后 的 值 
作为 有 符号 数 进行 比较 ， 如 果 前 者 小 于 后 者 ， 那 么 引发 自 陷 异 常 。 


e 当 16-20bit 的 值 为 5b01011 时 ， 表 示 是 tttiu 指 令 。 
SHX: ttiu rs, immediate. 


站 令 作 用 为 : if GPR[rs] < sign_extended(immediate) then trap， 将 地 
址 为 rs 的 通用 寄存 器 的 值 ， 与 指令 中 16 位 立即 数 符号 扩展 至 32 位 后 的 值 
作为 无 符号 数 进行 比较 ， 如 果 前 者 小 于 后 者 ， 那 么 引发 自 陷 异 常 。 





e 当 16-20bit 的 值 为 5b01110 时 ， 表 示 是 tnei 指 令 。 


和 令 用 法 为 : tnei rs, immediate. 


指令 作用 为 : if GPR[rs] # sign_extended(immediate) then trap， 将 地 
址 为 rs 的 通用 寄存 器 的 值 ， 与 指令 中 16 位 立即 数 符号 扩展 至 32 位 后 的 值 
进行 比较 ， 如 果 两 者 不 相等 ， 那 么 引发 自 陷 异常 。 


11.42 ”系统 调用 指令 syscall 


系统 调用 指令 syscall 的 格式 如 图 11-6 所 示 。 


31 26 25 6 5 0 





SPECTAT. SYSCALL, Fun 
000000 coge 001100 syscall 指 令 

















图 11-6 syscal1 指 令 的 格式 





从 图 11-6 可 知 ，syscall 指 令 的 指令 码 是 SPECIAL， 可 以 依据 第 0 一 
5bit 功 能 码 是 否 是 6b001100， 进 而 判断 是 否 是 syscall 指 令 。 另 外 ， 指 令 
中 的 第 6 一 25bit 是 code 字 段 ， 该 部 分 在 译 码 过 程 中 没有 作用 ， 被 忽略 
掉 ， 但 是 软件 可 以 利用 这 个 字段 保存 一 些 信息 。 


指令 用 法 为 : syscall。 


指令 作用 为 : 引发 系统 调用 异常 。MIPS32 架 构 定义 了 处 理 器 的 两 
种 工作 模式 : 用 户 模式 、 内 核 模 式 ， 前 一 种 是 受 限 模式 ， 有 些 操作 无 法 
进行 ， 大 多 用 于 用 户 的 应 用 程序 ， 后 者 主要 用 于 处 理 异常 和 具有 优先 权 
的 操作 系统 函数 ， 包 括 管理 协 处 理 器 CP0 和 IO 等 。 用 户 模式 下 的 程序 为 
了 执行 一 些 在 内 核 模式 下 才能 进行 的 操作 ， 可 以 调用 syscall 指 令 ，， 引 
发 系统 调用 异常 ， 进 入 异常 处 理 例 程 ， 从 而 进入 内 核 模式 。 用 户 模 式 、 
内 核 模 式 的 状态 标记 是 CP0 中 Status 寄 存 器 的 UM 字段 。 








OpenMIPS 不 区 分 用 户 模 式 、 内 核 模式 ， 所 以 没有 使 用 Status 寄 存 器 


的 UM 字 段 ， 也 就 是 说 ， 所 有 的 操作 都 没有 限制 ， 但 是 为 了 兼容 MIPS32 
指令 集 架 构 ， 还 是 实现 了 syscall 指 令 。 


11.43 FEREFE Seret 


异 第 返回 指令 eret 的 格式 如 图 11-7 所 示 。 


31 26 25 24 6 5 0 





COP0 |CO ERET ER 
mane 0000 0000 0000 0000 000 orte | et 
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图 11-7 异常 返回 指令 eret 的 格式 


从 图 11-7 可 知 ，eret 的 指令 码 是 COP0， 与 上 一 章 实 现 的 指令 mtc0、 
mfc0 的 指令 码 是 一 样 的 ， 但 是 第 0 一 5bit 功 能 码 的 值 是 6b011000， 而 且 
第 25bit 为 1， 第 6 一 24bit 都 为 0。 


HOHEN: eret 


指令 作用 为 : 从 异常 处 理 例 程 返回 ， 执 行 该 指令 ， 会 进行 如 下 操 
作 。 


(1) 使 FPC 寄存 融 的 值 成 为 新 的 取 指 地 址 。 





(2) 设置 Status 寄 存 圳 的 EXL 字 段 为 0， 表 示 不 再 处 于 异 各 级 。 


115 异常 处 理 实现 思路 


OpenMIPS 处 理 器 能 够 处 理 的 几 种 寞 第 ， 包 括 异 常 相关 指令 引起 的 
+ CARATS. syscall, AMES) 、 外 部 中 断 引起 的 异常 ， 以 及 执 
行 算术 运算 出 现 淤 出 引起 的 异常 。 这 儿 种 异常 的 处 理 过 程 都 是 一 致 的 。 
HKI EKME EELER, BARKI syscall, ARSE 
FAD ATES» MAEI DAR 11.6 AB EM SEEM ae i Sh LY FEE AE In 
ANE) AF BAA KTS EY A OR o 














还 有 一 点 ， 虽 然 异 常 返 回 指令 eret 不 是 引起 异常 的 指令 ， 但 是 eret 的 
执行 效果 与 寞 第 的 效果 非常 相似 : 取消 随后 所 有 指令 的 执行 、 转 移 到 新 
的 目标 地 址 (对 于 eret 指 令 而 言 ， 束 是 EPC 中 保存 的 地 址 )。 所 以 eret 指 
令 的 处 理 过 程 与 异常 处 理 过程 也 是 类 似 的 ， 可 以 称 为 “返回 异常 ”。 本 章 
结合 异常 处 理 的 实现 过 程 一 并 介绍 eret 指 令 的 实现 过 程 。 








11.5.1 ”实现 思路 


OpenMIPS 异 党 处 理 的 实现 思路 是 : 在 流水 线 的 各 个 阶段 收集 寞 蜗 
言 思 ， 并 传递 到 流水 线 访 存 阶段 ， 在 访 存 阶 段 统 一 处 理 异 党 信息 。 流 水 
线 各 个 阶段 需要 收集 的 异常 信息 如 下 。 








e 在 流水 线 译 人 码 阶段 判断 是 否 是 系统 调用 异常 、 是 否 是 返回 指 
Ls AER o 

© FETA BUT BT BO ce A AA UA. 

e 在 流水 线 访 存 阶 段 检查 是 否 有 中 断 发 生 。 








在 流水 线 访 存 阶段 ， 处 理 器 将 结合 协 处 理 器 CP0 中 相关 寄存 器 的 
值 ， 判 断 异 常 是 否 需要 处 理 ， 如 果 需 要 处 理 ， 那 么 转移 到 该 异常 对 应 的 
处 理 例 程 入 口 地 址 ， 清 除 流水 线 上 除 回 写 阶段 外 的 全 部 信息 〈 回 写 阶 段 
的 指令 要 继续 执行 ， 参 考 “ 精 确 异 常 ”一 节 的 描述 ) ， 同 时 ， 修 改 协 处 理 
器 CP0 中 相关 寄存 器 的 值 。 








如 果 是 eret 指 令 ， 那 么 转移 到 EPC 寄 存 器 保存 的 地 址 处 ， 同 时 ， 也 
要 清除 流水 线 上 除 回 写 阶段 外 的 全 部 信息 ， 修 改 协 处 理 器 CP0 中 相关 寄 
TF ar HJE o 





清除 流水 线 上 茶 个 阶段 的 信息 ， 实 际 就 是 将 该 阶段 中 的 所 有 寄存 器 
设置 为 初始 值 即 可 。 


11.5.2 ”修改 数据 流 图 


添加 异常 处 理 后 的 数据 流 图 如 图 11-8 所 示 ， 相 比 图 10-3， 在 访 存 阶 
段 增加 了 卉 第 判断 模块 ， 主 要 作用 是 依据 从 译 码 、 执 行 阶段 传递 过 来 的 
半 恩 ， 以 及 CP0 中 寄存 器 的 值 ， 判 断 是 否 要 处 理 异 第 ， 如 果 要 处 理 寞 
常 ， 那 么 按照 异 第 类 型 给 出 新 的 指令 地 址 送 入 PC。 
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取 指 se 译 码 执行 访 存 回 写 、 


Pit Pit 


图 11-8 添加 异常 处 理 后 的 数据 流 图 


11.5.3 ”修改 系统 结构 


为 了 实现 寞 第 处 理 ， 需 要 修改 系统 结构 ， 添 加 部 分 接口 ， 如 图 11-9 
所 示 。 主 要 有 如 下 几 扣 说明。 
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图 11-9 “为 实现 异常 处 理 而 对 0penMIPS 系 统 结构 所 做 的 修改 


(1) 流水 线 译 码 阶段 ID 模块 会 判断 是 否 是 系统 调用 指令 syscall、 
异 和 返回 指令 eret、 无 效 指令 ， 将 这 些 信 息 通过 excepttype_o 接 口传 递 到 
执行 阶段 ， 同 时 ， 还 将 指令 地 址 通过 current_inst_addr_o 接 口传 递 到 执行 
阶段 。 








(2) 流水 线 执行 阶段 EX 模块 会 进一步 判断 是 否 有 上 自 陷 异常 ， 或 者 
溢出 异常 。 这 些 信息 会 融合 到 译 码 阶段 给 出 的 噶 利 信息 中 《通过 EX 模 
块 的 excepttype_i 接 口传 入 ) ， 然 后 通过 excepttype_o 接 口传 递 到 访 存 阶 
段 。 同 时 ， 通 过 current_inst_addr_ o 接 口 将 指令 地 址 传递 到 访 存 阶 段 ， 通 
过 is_in_delayslot_o 接 口 指出 指令 是 否 位 于 延迟 槽 中 ， 该 信息 也 被 传递 到 
访 存 阶段 。 











(3) 流水 线 访 存 阶段 MEM 模 块 会 依据 传递 过 来 的 异常 类 型 
excepttype_i、Cause 寄 存 器 的 值 (通过 cp0_cause_i 接 口 输入 ) ~ Status% 
存 右 的 值 〈“ 通 过 cp0_status_i 接 口 输 入 〉 ， 综 合 判 断 是 否 需 要 处 理 异常 ， 
如 果 需 要 处 理 ， 那 么 最 终 的 异常 类 型 会 通过 excepttype_o 接 口 送 入 CTRL 
模块 ，CTRL 模 块 据 此 给 出 异常 处 理 入 口 地 址 (通过 new_pc 接 口 送 至 
PC) 。 


(4) 如 果 要 处 理 异常 ， 那 么 还 需要 修改 协 处 理 器 CP0 中 EPC、 
Status、Cause 等 寄存 器 的 值 ， 所 以 访 存 阶段 给 出 的 最 终 的 异常 类 型 还 要 
通过 excepttype_o 接 口 送 入 CP0 模 块 ， 同 时 送 入 的 还 有 发 生 异 常 的 指令 是 
否 在 延迟 槽 中 (通过 is_in_delayslot_i 接 口 送 入 ) 、 友 生 异 和 常 的 指令 的 地 
址 (通过 current_inst_address_o 接 口 送 入 ) 。CP0 模 块 依据 这 些 信息 修改 
相应 寄存 器 的 值 。 





(5) 如 果 要 处 理 异常 ， 那 么 还 需要 清除 流水 线 上 除 回 写 阶段 外 的 
所 有 寄存 器 的 值 ，CTRL 模 块 通过 送出 flush 信 号 实现 此 目的 。 从 图 11-9 


可 知 ，flush 信 号 送 到 PC、IF/ID、ID/EX、EX/MEM、MEM/WB 等 模 
块 ， 会 将 这 些 模 块 中 的 寄存 器 置 为 初始 值 。 


(6) 在 第 9 章 实现 1、sc 指 令 的 时 候 引 入 了 LLbit 寄 存 器 ， 当 1 指令 
执行 的 时 候 会 设置 LLbit 为 1， 当 sc 指令 执行 的 时 候 ， 会 检查 该 寄存 器 是 
否 为 1， 如 果 为 1 就 正常 执行 ; 如 果 为 0， 那 么 认为 出 现 了 干扰 ， 不 进行 
存储 操作 。 出 现 干 扰 的 原因 之 一 就 是 在 由、sc 指 令 之 间 产 生 了 异常 ， 所 
以 在 异常 处 理 过 程 中 会 多 进行 一 步 操作 ， 就 是 将 LLbit 寄 存 器 置 为 0。 这 
也 是 图 11-9 中 LLbit 模 块 也 有 flush 信 号 输入 的 原因 。 





11.6 ”修改 OpenMIPS 以 实现 异常 
处 理 


11.6.1 修改 取 指 阶段 


1. 修改 PC 模块 


从 图 11-9 可 知 ，PC 模 块 会 增加 部 分 接口 ， 如 表 11-3 所 示 。 


表 11-3 PC 模块 增加 的 接口 


输入 /输出 
1 flush 1 流 


输入 流水 线 清除 信和 号 


异常 处 理 例 程 入 口 地 址 











PC 模块 的 代码 修改 如 下 ， 修 改 部 分 使 用 加 粗 、 和 斜体 强调 。 完 整 代 
码 请 参考 本 书 附带 光盘 Code\Chapter11 目 录 下 的 pc_reg.v 文 件 。 


module pc_reg( 


input wire flush, 


input wire[ RegBus] new_pc, 








2. 修改 IF/ID 模 块 
从 图 11-9 可 知 ，IF/ID 模 块 也 要 增加 部 分 接口 ， 如 表 11-4 所 示 。 


表 11-4 1F/1D 模 块 增加 的 接口 





IF/ID 模 块 的 代码 修改 如 下 ， 修 改 部 分 使 用 加 粗 、 和 斜体 强调 。 完 整 
代码 请 参考 本 书 附 带 光 盘 中 Code\Chapter11 目 录 下 的 if_id.v 文 件 。 








11.6.2 ”修改 译 码 阶段 


修改 ID 模 块 


从 图 11-9 可 知 ， 译 码 阶段 ID 模块 也 要 增加 部 分 接口 ， 如 表 11-5 所 
人 No 


表 11-5 ”1D 模块 增加 的 接口 


NE EE ER EEE 








译 码 阶段 DD 模块 要 增加 对 自 陷 指令 、 系 统 调用 指令 syscall、 寞 和 常 返 
回 指令 eret 的 译 码 过 程 ， 首 先 要 确定 是 哪 一 种 指令 ， 确 定 指令 的 过 程 如 
图 11-10 所 示 。 其 中 对 eret 指 令 的 确定 比较 特别 ， 是 直接 将 指令 与 宏 定 义 
EXE_ERET 比 较 ， 如 果 相 等 ， 那 么 就 是 eret 指 令 。 
















































































































































































= EXE_SPECIAL_INST =EXE_TEQ 
$ =e 
op > op3 > teq 指 令 
=EXE_TGE = 
tge 指 令 
=EXE_TGEU 
a : a nl 指令 
= EXE_REGIMM_INST = EXE TEQI tgeu Aw 
> op4 = > teqi 指 令 =EXE_TLT Jgs 
> tiks 
-EXE_TGEI EB 
一 一 一 一 > tgei 指 令 -EXE_TLTU 
> tltu 指 令 
-EXE_TGEIU ASIA 
一 一 一 一 > tgeiu 指 令 —EXE_TNE 
N EXE_TLTI > tne 指 令 
int >> eret #4 一 一 -一 一 > tlti 指 令 =EXE_SYSCALL = 
g > Syscall 指 令 
SEXE TLTIU | jiu 指令 
> ...... 
wire[5:0] op = inst_i[31:26]; =EXE_TNEI yl tneif> 
wire[5:0] op3 = inst_i[5:0]; 
wire[4:0] op4 = inst_i[20:16]; A ee 














图 11-10 ”确定 自 陷 指 令 、syscal1 指 令 、eret 指 令 的 过 程 


其 中 涉及 的 宏 定 义 如 下 ， 在 本 书 附 市 光盘 中 Code\Chapter11 目 录 下 


的 defines.v 文 件 中 可 以 找到 这 些 定 义 。 





ID 模 块 的 代码 主要 修改 如 下 ， 完 整 代码 位 于 本 书 光盘 
Code\Chapter11 目 录 下 的 id.v 文 件 。 
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输 详 码 、 执 行 阶段 收集 到 的 异常 信息 
| mem eurent inst address | 32 | 输出 | wreme eisa: 


= 





always @ (posedge clk) begin 


if(rst == ~RstEnable) begin // 复 位 
mem_excepttype <= "ZeroWord; 
mem_is_in_delayslot <= "NotInDelaySlot; 


mem_current_inst_address <= "ZeroWord; 


end else 

if(flush == 1'b1 ) begin /7 清除 流水 线 
mem_wd <= ~NOPRegAddr; 
mem_wreg <= "WriteDisable; 
mem_wdata <= ~ZeroWord; 
mem_hi <= ~ZeroWord; 
mem_lo <= ~ZeroWord; 
mem_whilo <= 'WriteDisable; 
mem_aluop <= ~EXE_NOP_OP; 
mem_mem_addr <= "ZeroWord; 
mem_reg2 <= ~ZeroWord; 
mem_cp0_reg_we <= "WriteDisable; 
mem_cp0_reg write_addr <= 5'b00000; 
mem_cp0_reg data <= ~Zeroword; 
mem_excepttype <= "ZeroWord; 
mem_is in delayslot <= "NotInDelaySlot; 
mem_current_inst_address <= "ZeroWord; 
hilo_o <= { ZeroWord, "ZeroWord]; 


cnt_o <= 2'b00; 








[2 | cumrentimstadaress io |32 | 输入 | 访 存 阶 段 指令 的 地 址 
访 存 阶段 的 指令 是 否 是 延迟 梢 指令 


0 [rosa O fa Sian [orot sas | 
5 eom | Sian | eros cases | 
[ones fe [mr oora — | 
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excepttype_o = 32'h00000001 


36 Vil FE syscall? excepttype_o = 32'h00000008 
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Ian > 
u 


无 效 指令 ? excepttype_o = 32'h00000002 


excepttype_o = 32'h0000000d 





excepttype_o = 32'h0000000c 


excepttype_o = 32'h0000000e 


ll 





FF = | a 加 | A JE (bit) | kan 输出 | E 用 
ica 











序 > 接口 名 = (bi 
a oe rae O 


is in delayslot_o MA CAE SEHK O ETERNA 























2 oa + mM 45 SSS ein FA /FA 4 q 
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出 是 否 清除 流水 线 




















rom ce o 
rom_addr_o 
ram_addr_o 
ram_data_o 
ram_sel_o 
ram_we_o 
ram_ce_o 


openmips.v 

















if pe 就 是 取 指 地 址 ， 在 这 里 变 为 0xX40， 就 是 转移 到 系统 调用 异常 处 理 例 程 


Sto 
Sti | 
000... | 300000104 100000108 }D0000 10c 100000110 100000114 100000118 100000040 j000000 


000... (00000100 00001000 





de rst sto 
$ ck sto 
+ if_pc 000... | _}00000048 }0000004c }00000050 }00000054 }00000053 }0000005c }00000060 }00000110 
3-@ regfiei/regs[1] |000... 
系统 调用 异常 处 理 例 程 会 修改 $1 寄 存 器 的 值 ， 
依次 改 为 0x8000、0x9000、0x10c、0x110 


— LI LI LS LI LI LI LI L 


O... 100000114 00000118 }0000011c (00000118 }0000011c }00000118 }0000011c }0000011: 

















teq $1.$2 指 令 满 足 自 陷 异 常 发 生 条 件 ， 所 以 进入 异常 处 理 例 程 


N If If LS Lt U 
EEE: Í Oxf OXOR 表示 进入 了 异常 处 理 例 程 
tne$1.$2 指 令 满足 自 陷 异常 发 生 条 件 ， 所 以 进入 异常 处 理 例 程 
m rst 
» ck sto ASAS LL 
1-4 regfle 1/regs[2] 00... 


teqi $1.0X3000 指 令 满 足 白 陷 异 常 发 生 条 件 ， 所 以 进入 蜡 常 处 理 例 程 
oat a E y 


tnei $1,0x2000 指 令 满 足 自 陷 异常 发 生 条 件 ， 所 以 进入 异常 处 理 例 程 


000... 


tge $1.$2 指 令 满足 白 陷 异常 发 生 条 件 ， 所 以 进入 蜡 常 处 理 例 程 


Tio O Le te LT LT 


+ [00005000 oO FOFOOOOOFF Joo000fOf | 
00... {00001000 


teei$1,0x4000 指 令 满足 自 陷 异 常 发 生 条 件 ， 所 以 进入 异常 处 理 例 程 | 
Sto 


AAA OA N 


tegeu$1.$2 指 令 满足 自 陷 异常 发 生 条 件 ， 所 以 进入 异常 处 理 例 程 
sto 
x sto ier feed et bat er CE ak get E 
34» regfilei/regs[1] 000... 00008000  jbooofOfa Jnoooffff 000000F 





tlt $1,$2 指 令 不 满足 自 陷 异 常 发 生 条 件 ， 所 以 没有 进入 
异常 处 理 例 程 












rst Sto 
© dk sto Free 
B® regfieifregst2] Joo... [aa | S SSS 


tlti $1,0x9000 指 令 不 满足 自 陷 异常 发 生 条 件 ， 所 以 没有 
进入 异常 处 理 例 程 
















tltiu $1,0xb000 指 令 满 足 自 陷 异 常 发 生 条 件 ， 所 以 进入 异常 处 理 例 程 
sto 


















regfileifregs[1] (000... [0...Joo00b000 FOF. pooo jpoooofof 
A AAA a] 






regfile1/regs[2] 00... 
titu $2,$1 指 令 满足 自 陷 异 常 发 生 条 件 ， 所 以 进入 异常 处 理 例 程 






+ 1 _}0000c000 oooofofo‘jooooffff Jooooofof 
00001000 


最 后 ，ori $1,$0,0xd000 指 令 使 得 $1 的 值 为 0xd000 



















| “如 000d000 

一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
00001000 
一 








(1) 每 隔 一 段 时 间 ， 当 Count 寄 存 器 的 值 等 于 Compare 寄 存 
器 的 值 时 ， 会 声明 时 钟 中 断 ， 设 置 输出 信号 timer_int_o 为 1 


(2) 时 钟 中 断 发 生 后 ， 会 进入 中 断 处 理 例 程 ， 在 其 中 将 Compare 
寄存 器 的 值 加 100〈 注 意 : 图 中 显示 的 Compare 的 值 是 十 六 进 制 ) 


(3) 时 钟 中 断 发 生 后 ， 会 进入 中 断 处 理 例 程 ， 
在 其 中 将 寄存 器 $2 的 值 加 1 
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第 12 晶 ”实践 版 0penM1PS 处 理 怖 设 
计 与 实现 
经 过 第 4 一 11 章 ， 一 步 一 步 地 完善 、 补 充 ， 最 终 实 现 了 我 们 在 第 3 章 


中 设计 的 教学 版 OpenMIPS 处 理 器 ， 但 是 教学 版 OpenMIPS 处 理 器 距离 实 
用 还 有 一 点 差距 ， 这 也 就 是 实践 版 OpenMIPS 处 理 器 需要 解决 的 问题 。 




















本 章 将 介绍 实践 版 OpenMIPS 处 理 器 的 设计 与 实现 ， 首 先 在 12.1 节 
给 出 了 实践 版 OpenMIPS 处 理 器 的 设计 目标 ， 重 点 说 明 实 践 版 OpenMIPS 
与 教学 版 OpenMIPS 的 区 别 ， 以 及 添加 总 线 接口 的 原因 。 接 着 在 12.2 节 
详细 说 明 Wishbone 总 线 接口 ，12.3 节 给 出 了 添加 Wishbone 总 线 接口 后 的 
实践 版 OpenMIPS 人 处理 器 接口 图 。 然 后 在 12.4 节 介绍 实践 版 OpenMIPS 处 
理 器 的 实现 思路 。 最 后 ， 在 12.5 节 通过 修改 教学 版 OpenMIPS 人 处理 器 的 
代码 ， 实 现实 践 版 OpenMIPS 处 理 器 。 


12.1 实践 版 OpenMIPS 处 理 器 的 
设计 目标 


己 实 现 的 教学 版 OpenMIPS 处 理 器 的 主要 设想 是 尽量 简单 ， 比 如 : 

在 一 个 时 钟 周 期 内 可 以 取 到 指令 ， 完 成 存储 、 加 载 数据 ， 这 样 处 理 器 的 
运行 情况 《主要 是 流水 线 的 运行 情况 ) 就 比较 理想 化 ， 与 教科 书 相 似 ， 
代码 也 很 简单 清晰 ， 便 于 使 用 其 进行 教学 、 学 术 研 究 和 讨论 ， 也 有 助 于 
学 生理 解 课堂 上 讲授 的 知识 。 所 以 ， 我 们 在 构建 基于 教学 版 OpenMIPS 
的 最 小 SOPC 时 ， 指 令 存储 器 ROM、 数 据 存 储 器 RAM 都 可 以 位 于 FPGA 
内 部 ， 以 满足 教学 版 OpenMIPS 的 特殊 要 求 。 因 此 ， 教 学 版 OpenMIPS 的 
接口 也 比较 简单 ， 主 要 就 是 与 ROM、RAM 的 接口 。 如 图 12-1 所 示 。 
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ROM RAM 





























图 12-1 基于 教学 版 0penMIPS 的 最 小 SOPC 的 结构 ， 其 指令 存储 器 ROM、 数 据 存 储 器 RAM 都 位 于 


FPGA 内 





但 是 在 实际 应 用 中 ， 程序 的 体积 可 能 非常 大 ， 指 令 存 储 器 就 不 能 
集成 在 FPGA 内 部 了 ， 一 般 使 用 FPGA 芯 片 外 部 的 Flash 作 为 指令 存储 
器 。 同 理 ， 一 般 使 用 FPGA 心 片 外 部 的 SDRAM 作 为 数据 存储 器 ， 如 图 


12-2 所 示 。 


FPGA 








OpenMIPS 


Flash SDRAM 


图 12-2 实际 应 用 中 ， 指 令 存 储 器 、 数 据 存 储 器 位 于 FPGA 外 部 



































因此 ， 为 了 使 OpenMIPS 实 用 化 ， 需 要 为 其 添加 Flash 控 制 器 、 
SDRAM 控 制 器 ， 如 图 12-3 所 示 。 
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图 12-3 ”为 OpenMIPS 添 加 Flash 控 制 器 、SDRAM 控 制 器 以 使 其 实用 化 


更 进一步 ， 如 果 要 使 用 FPGA 芯 片 外 部 的 SRAM， 那 么 需要 再 为 
OpenMIPS 添 加 SRAM 控 制 器 ， 如 果 要 使 用 串口 ， 那 么 需要 再 为 
OpenMIPS 添 加 UARTI 控 制 器 。 读 者 一 定 发 现 了 一 个 问题 : 每 添加 一 个 
外 部 设备 ， 都 要 修改 OpenMIPS。 是 的 ， 图 12-3 的 做 法 不 具有 良好 的 扩 
展 性 。 


参考 一 下 常用 的 PC， 其 一 般 都 提供 PCI 总 线 接 口 ， 各 种 板 卡 《包括 
wR. BER MR BRA PAAR) 只 要 满足 PCI 总 线 接口 标 
准 ， 就 可 以 直接 插 在 PC 的 PCI 插 模 使 用 ， 十 分 方便 ， 并 不 需要 修改 处 理 
器 。 借 鉴 这 种 方式 ， 我 们 只 需要 为 OpenMIPS 添 加 通用 总 线 接口 ， 就 可 
以 方便 地 接 入 新 设备 。OpenMIPS 通 过 总 线 接口 挂 在 总 线 上 ， 各 种 外 部 
设备 的 控制 器 也 挂 在 总 线 上 ， 如 图 12-4 所 示 。 因 为 OpenMIPS 采 用 的 是 
哈佛 结构 ， 所 以 有 两 个 总 线 接口 ， 分 别 是 指令 总 线 接口 和 数据 总 线 接 
口 。 图 12-4 中 的 Flash 控 制 器 、SDRAM 控 制 器 、SRAM 控 制 器 、UART 控 
制 器 都 有 具有 同样 的 总 线 接口 ， 都 可 以 挂 在 总 线 上 ， 并 且 都 可 以 放置 在 
FPGA 内 部 。 如 果 要 添加 其 他 设备 控制 器 ， 那 么 只 要 具有 相同 的 总 线 接 
口 ， 就 可 以 直接 挂 在 总 线 上 ， 不 需要 修改 OpenMIPS。 
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图 12-4 改进 的 连接 外 部 设备 的 方法 一 一 通过 总 线 


各 种 控制 占 可 以 直接 使 用 已 有 的 人 P 核 ， 目 前 有 很 多 IP 核 的 研发 者 或 
公司 ， 为 了 方便 不 同 研发 者 或 公司 的 IP 核 能 够 互相 连接 ， 就 要 求 这 些 IP 
核 遵守 相同 的 总 线 规范 。 总 线 规范 定义 了 卫 核 之 间 的 通用 接口 。 第 见 的 


片上 总 线 规范 有 ARM 公 司 的 AMBA、IBM 公 司 的 CoreConnect、Altera 公 
司 的 Avalon， 以 及 Wishbone， 本 书 的 实践 版 OpenMIPS 采 用 的 就 是 
Wishbone 总 线 规范 。Wishbone 总 线 规范 是 Silicore 公 司 最 先 提出 的 ， 由 
于 其 开放 性 ， 现 在 已 有 不 少 用 户 群 ， 特 别 是 一 些 开源 的 人 P 核 ， 大 多 数 都 
采用 Wishbone 规 范 。 


综合 上 述 分析 ， 实 践 版 OpenMIPS 处 理 器 的 设计 目标 就 是 在 教学 版 
OpenMIPS 处 理 器 的 基础 上 添加 Wishbone 总 线 接口 ， 这 样 就 能 方便 地 将 
其 挂 接 在 Wishbone 总 线 上 ， 从 而 可 以 使 用 大 量 开源 的 SDRAM、EFlash、 
GPIO、UART、LCD 等 模块 的 控制 器 ， 组 成 一 个 SOPC， 完 成 特定 功 
能 ， 成 为 一 个 能 发 挥 实际 作用 的 处 理 器 。 


12.2 Wishbone 总 线 介 绍 


12.2.1 Wishbone 总 线 接口 说 明 


Wishbone 除 了 开放 、 免 费 ， 还 有 简单 、 灵 活 、 轻 量 、 文 持 用 户 目 定 
义 标签 等 特点 。 目 前 已 发 布 B4 版 本 的 规范 ，OpenMIPS 处 理 器 遵循 的 是 
Wishbone B2 版 本 的 规范 。 


Wishbone 有 多 种 连接 方式 : RARO BUE. KEAR LX 
等 。 在 点 对 点 连接 方式 中 ， 有 一 个 主 设备 ， 一 个 从 设备 ， 连 接 关 系 如 图 
12-5 所 示 ， 注 意图 中 输出 信号 的 名 称 使 用 “_O” 结 束 ， 输 入 信号 的 名 称 使 
用 “_ 了 I* 结 束 。 此 外 ， 所 有 的 信号 都 是 高 电 平 有 效 。 
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图 12-5 Wishbone 总 线 规范 点 对 点 连接 方式 


图 12-5 中 ， 主 、 从 设备 的 接口 含义 如 下 。 








(1) CLK, RSTI: 分 别 是 时 钟 信号 、 复 位 信号 ， 由 外 部 输入 。 


(2) DAT_O/DAT_I: 数据 总 线 ， 数 据 可 以 由 主 设备 传送 给 从 设 
备 ， 也 可 以 由 从 设备 传送 给 主 设备 。 一 对 主 设备 和 从 设备 之 间 最 多 存在 
两 条 数据 总 线 ， 一 条 用 于 主 设备 回 从 设备 传输 数据 ， 另 一 条 用 于 从 设备 
同 主 设备 传输 数据 。 








(3) ADR_O/ADR I: 地 址 总 线 ， 地 址 由 主 设备 传送 给 从 设备 。 


(4) WE_O/WE_I: 写 使 能 信号 ， 由 主 设备 传送 给 从 设备 ， 代 表 当 
前 进行 的 是 写 操作 还 是 读 操作 ，1 代 表 写 操作 ，0 代 表 读 操作 。 


(5) SEL_O/SEL_I: 数据 总 线 选择 信号 ， 用 于 标识 当前 操作 中 ， 
数据 总 线 上 哪些 比特 是 有 效 的 ， 以 总 线 粒 度 为 单位 。SEL_O/SEL _I 的 宽 
度 为 数据 总 线 宽度 除 以 数据 总 线 粒 度 。 比 如 一 个 具有 32 位 宽 、 粒 度 为 1 
个 字 节 的 数据 总 线 的 选择 信号 应 定义 为 SEL_O(3:0)/ SEL_I(3:0)， 此 时 ， 
SEL_O(4”b1001) 就 代表 当前 操作 中 数据 总 线 的 最 高 和 最 低 字 节 有 效 。 











(6) CYC_O/CYC_I: 总 线 周 期 信号 ，CYC_O/CYC_I 有 效 代 表 一 
个 主 设备 请 求 总 线 使 用 权 或 者 正在 占有 总 线 ， 但 是 不 一 定 正 在 进行 总 线 
操作 (是 否 正在 进行 总 线 操作 取决 于 选 通 信号 STB_O/STB_I 是 否 有 
效 ) 。 只 有 在 CYC_O/CYC_I 信 号 有 效 的 情况 下 ，Wishbone 主 设备 和 从 
设备 之 间 的 其 他 信号 才 有 意义 。CYC_O/CYC _I 信 号 在 一 次 总 线 操作 过 
程 中 必须 持续 有 效 ， 比 如 : 一 次 块 读 操 作 可 能 需要 多 个 时 钟 周期 ， 那 么 
CYC_O/CYC _I 信 号 必须 在 这 多 个 时 钟 周 期 持续 有 效 。 








(7) STB_OSTBI: 选 通信 号 。 选 通信 号 有 效 代 表 主 设备 发 起 一 
次 总 线 操作 。 只 有 选 通信 号 有 效 时 〈 此 时 CYC_O/CYC I 也 必须 有 
效 ) , ADR O/ADR Il, DAT O/DAT I, SEL O/SEL I 才 有 意义 。 


(8) ACK_O/ACK_I: 实际 还 可 以 有 ERR_O/ERR_T、 
RTY_O/RTY_I， 都 是 主 从 设备 间 的 操作 结束 信和 号。ACK ”表示 成 功 ， 
ERR 表示 错误 ，RTY 表示 重 试 。 操 作 总 是 在 某 一 总 线 周 期 内 完成 的 ， 
因此 操作 结束 也 称 为 总 线 周 期 结束 。 成 功 是 操作 的 正常 结束 方式 ， 错 误 
表示 操作 失败 ， 造 成 失败 的 原因 可 能 是 地 址 或 者 数据 校 验 错误 ， 写 操作 
或 者 读 操作 不 支持 等 。 重 试 表示 从 设备 当前 忙 ， 不 能 及 时 处 理 该 操作 ， 
可 以 稍 后 重新 发 起 。 接 收 到 操作 失败 或 者 重 试 后 ， 主 设备 如 何 响应 取决 


于 主 设备 的 设计 者 。 


(9) TAGN_O/TAGNLI: 标签 信号 ， 用 户 可 以 利用 标签 信和 号 传递 
自 定 义 的 信息 。 


一 个 总 线 周 期 由 多 个 时 钟 周期 构成 ， 用 来 完成 一 次 操作 ， 可 以 是 单 
次 读 / 写 操作 、 块 读 / 写 操作 、 读 改写 操作 ， 总 线 周期 也 相应 分 为 单 次 读 / 
写 周 期 、 块 读 / 写 周期 、 读 改写 周期 。 本 节 重 点 介绍 单 次 读 / 写 周期 。 


一 般 情况 下 ， 一 次 操作 由 主 设备 和 从 设备 之 间 的 一 次 握手 ， 以 及 同 
时 进行 的 地 址 和 数据 总 线 的 一 次 传输 构成 。 当 主 设备 将 CYC_O 置 融 ， 
一 个 总 线 周期 开始 ， 此 后 当 STB_O 为 高 时 ， 一 次 总 线 操作 开始 。 
CYC_O 和 STB_O 可 以 同时 从 低 电 平 变 为 高 电 平 ， 表 示 开 始 总 线 周 期 的 
同时 发 起 一 次 总 线 操作 。 





以 下 分 别 介绍 Wishbone 总 线 单 次 读 操 作 、 单 次 写 操作 的 过 程 。 


12.2.2 ”Wishbone 总 线 单 次 该 操作 的 
过 程 
主 从 设备 之 间 的 信号 虽然 很 多 ， 但 单 次 读 / 写 操作 实际 上 十 分 简 


单 。 单 次 读 操 作 的 Wishbone 总 线 信号 如 图 12-6 所 示 ， 此 处 是 从 主 设备 的 
角度 观察 信号 变化 情况 。 
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图 12-6 Wishbone 总 线 单 次 读 操 作 时 主 设备 的 信号 (不 考虑 TAGN_0/TAGN_1) 





在 时 钟 上 升 沿 0， 主 设备 将 地 址 信号 ADR_O、 适 当 的 SEL_O 放 到 总 
线 上 。 将 WE_O 置 低 ， 表 示 读 操作 。 将 CYC_O、STB_O 置 高 表示 一 次 总 
线 操作 开始 。 


在 时 钟 上 升 沿 1 到 达 之 前 ， 从 设备 检测 到 主 设 备 发 起 的 操作 ， 将 适 
当 的 数据 放 到 主 设备 的 输入 接口 DAT_I， 同 时 将 主 设备 的 输入 ACK_I 置 
高 ， 作 为 对 主 设备 STB_O 的 啊 应 。 从 设备 可 以 在 设置 ACK_I 有 效 之 前 ， 
插入 任意 数量 的 等 待 状态 。 





在 时 钟 上 升 沿 1， 主 设备 发 现 ACK _I 信 号 为 高 ， 于 是 采样 DAT TS 
号 ， 作 为 读 取 到 的 数据 ， 并 将 CYC_O 和 STB_O 置 低 ， 表 示 操 作 完 成 。 
从 设备 检测 到 STB_O 置 低 后， 将 主 设备 的 输入 ACK_I 也 置 低 。 单 次 读 操 








fem TEM o 


12.2.3 Wishbone Zé EX SEIEN 
过 程 


单 次 写 操作 的 Wishbone 总 线 信号 如 图 12-7 所 示 ， 此 处 还 是 从 主 设备 
的 角度 观察 信号 变化 情况 。 
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图 12-7 Wishbone 总 线 单 次 写 操 作 时 主 设备 的 信号 (不 考虑 TAGN 0/TAGN_1) 


在 时 钟 上 升 沿 0， 主 设备 将 地 址 信号 ADR_O、 数 据 信 号 DAT_O 放 到 
总 线 上 ， 将 WE_O 置 高 ， 表 示 写 操作 。 将 适当 的 SEL_O 放 到 总 线 上 ， 以 
告诉 从 设备 DAT_O 中 哪些 字 节 是 有 效 的 。 将 CYC_O、STB_O 置 高 ， 表 





示 一 次 总 线 操 作 开始 。 


在 时 钟 上 升 沿 1 到 达 之 前 ， 从 设备 检测 到 主 设备 发 起 的 操作 ， 于 是 
锁 存 DAT_O 的 数据 ， 同 时 将 主 设备 的 输入 ACK_I 置 高 ， 作 为 对 主 设备 
STB_O 的 响应 。 从 设备 可 以 在 设置 ACK_I 有 效 之 前 ， 插 入 任意 数量 的 等 
FRIAS o 








在 时 钟 上 升 沿 1， 主 设备 发 现 ACK_I 信 号 为 高 ， 于 是 将 STB_O 和 
CYC_O 置 低 ， 表 示 操 作 完 成 。 从 设备 检测 到 STB_O 置 低 后 ， 将 主 设备 
的 输入 信号 ACK_I 也 置 低 。 单 次 写 操作 就 完成 了 。 








以 上 两 小 市 介绍 了 Wishbone 忌 线 规 范 的 单 次 读 / 写 操作 的 操作 周 
期 ， 本 书 不 打算 介绍 Wishbone 总 线 规范 的 块 读 / 写 、 读 改写 操作 对 应 的 
操作 周期 ， 因 为 实践 版 OpenMIPS 处 理 器 只 使 用 到 了 单 次 读 / 写 操作 。 


12.2.4 SEL_O/SEL I 信号 说 明 


了 解 了 Wishbone 总 线 规范 ， 现 在 可 以 解答 我 们 在 第 9 章 “ 加 载 存 储 指 
令 的 实现 ”中 遇 到 的 一 个 问题 ， 在 9.3.3 节 解释 lb 指令 的 访 存 过 程 时 ， 提 
出 如 下 问题 。 


“为 何不 直接 设置 mem_sel_0 为 4'b0001， 表 示 希 望 数据 存储 器 给 出 
的 数据 的 第 0-7bit 束 是 要 读 取 的 字 节 ， 而 不 考虑 mem_addr i 的 最 后 两 
位 为 何 值 ， 这 样 不 是 更 简单 吗 ? > 


当时 的 解释 如 下 。 


“的 确 ， 这 样 做 是 更 简单 了 ， 但 是 这 里 确定 mem_sel_o 值 的 过 程 实 


际 上 参考 了 Wishbone 总 线 的 相关 规范 ， 为 了 是 在 后 期 给 OpenMIPS 添 
加 Wishbone 总 线 接口 的 时 候 容 易 一 些 。” 


在 Wishbone 总 线 规 范 中 ， 对 主 设备 的 输出 SEL_O《〈 也 就 是 从 设备 的 
输入 SEL_I) 是 有 有 具体 规定 的 ， 不 同 的 总 线 宽度 、 不 同 的 大 小 端 模式 ， 
这 个 规定 是 不 同 的 。 因 为 OpenMIPS 的 地 址 、 数 据 总 线 宽度 是 32bit， 并 
且 是 大 端 模式 ， 所 以 此 处 只 介绍 当地 址 、 数 据 总 线 宽 度 是 32bit， 且 为 大 
端 模 式 时 的 规定 。 





读 操 作 时 ， 主 设备 通过 ADR_O 送 出 32 位 的 地 址 ， 从 设备 将 ADR_O 
最 低 两 位 置 为 0， 作 为 目标 地 址 ， 给 出 对 应 的 32 位 数据 ， 输 入 到 主 设备 
的 接口 DAT_I。Wishbone 总 线 规范 明确 了 主 设备 的 DAT_I 与 SEL_O 的 对 
应 关系 ， 如 图 12-8 所 示 。 
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fADR_O[31:2], 2'b01} 地 址 
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{ADR_O[31:2], 2b10} 地 址 
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12-8 读 操作 时 ，DAT_1 与 SEL 0 的 对 应 关系 


所 以 ， 假 设 Ib 指 令 的 加 载 目 标 地 址 的 最 低 两 位 是 10， 那 么 就 要 求 设 
置 mem_sel 0 为 4b0010。 


写 操作 时 ， 主 设备 通过 ADR_O 送 出 32 位 的 地 址 ， 从 设备 将 ADR_O 


最 低 两 位 置 为 0， 作 为 目标 地 址 。Wishbone 总 线 规 范 明 确 了 主 设 备 的 
DAT_0O 与 SEL_O 的 对 应 关系 如 图 12-9 所 示 。 


DAT O 


SEL_O 


31 24 23 


16 


15 


8 


T 


0 





本 字 节 写 入 地 址 
{ADR_O[31:2], 2b00} 处 


本 字 节 写 入 地 址 
{ADR_O[31:2], 2b01} 处 


本 字 节 写 入 地 址 
(ADR_O[31:2]. 2b10} 处 


本 字 节 写 入 地 址 
{ADR_O[31:2], 2b11} 处 





人 


ji 


上 


1 








SEL_O[3] 





SEL_O[2] 





SEL_O[1] 





SEL_O[0] 








图 12-9 写 操作 时 ，DAT_0 与 SEL_0 的 对 应 关系 


所 以 ， 假 设 sb 指令 的 存储 目标 地 址 的 最 低 两 位 是 10， 那 么 就 要 求 设 
置 mem_sel 0 为 4b0010。 


现在 ， 读 者 可 以 回 到 9.3.3 节 ， 体 会 加 载 存储 指令 的 访 存 过 程 ， 尤 其 





是 其 中 对 信 与 mem_sel_o 的 赋值 ， 应 该 可 以 理解 了 。 


12.3 ”实践 版 OpenMIPS 处 理 器 接 
口 


实践 版 OpenMIPS 处 理 器 仍然 采用 哈佛 结构 ， 即 分 开 的 指令 、 数 据 
接口 。 其 接口 如 图 12-10 所 示 。 还 是 采用 左边 是 输入 接口 ， 石 边 是 输出 
接口 的 方式 绘制 ， 这 样 比 较 直 观 ， 便 于 理解 。 


OpenMIPS (KRR) 


iwishbone_addr_o ~ 








— iwishbone_data_i iwishbone_data_o }—— 
— iwishbone_ack i iwishbone_we_o —— 
iwishbone_sel_o | 一 
iwishbone_stb_o }—— 
iwishbone_cyc_o }—— 
dwishbone_addr_o ~ 
—— dwishbone_data_i dwishbone_data_o 六 -一 
— dwishbone_ack_i dwishbone_we_o 上 一 
dwishbone_sel_o | 


— int i dwishbone_stb_o }—— 
—— rst dwishbone_cyc_o }—— 
— clk timer_int_o -— 











图 12-10 实践 版 0penMIPS 处 理 器 的 外 部 接口 图 


读者 可 以 对 比 图 3-4 教 学 版 OpenMIPS 处 理 器 的 外 部 接口 图 ， 从 中 可 
以 发 现 图 12-10 只 是 将 图 3-4 中 的 指令 存储 器 、 数 据 存储 器 的 接口 分 别 换 
成 指令 Wishbone 总 线 接口 、 数 据 Wishbone 总 线 接口 ， 其 余 未 变 。 各 个 接 
口 的 描述 如 表 12-1 所 未 。 


表 12-1 实践 版 0penMIPS 处 理 器 外 部 接口 描述 


| 序 号 | 接口 名 [eo mm | 作用 O | 
INC Ion Ta 
2e E En 


ls 


输入 


6 个 外 部 硬件 中 断 输 入 
是 否 否 有 定时 中 断 发 生 





iwishbone_addr_o 
iwishbone data o 
iwishbone_we_o 


iwishbone sel o 


指令 Wishbone 总 线 输 ! 


指令 Wishbone 总 线 输 ! 


74 Wishbone 总 线 字 


的 地 址 
1 的 数据 





iwishbone_stb_o 


fen 
o 


iwishbone_cyc_o 





指令 


指令 Wishbone 总 线 膨 





Wishbone 总 线 选 通信 





if: 


iwishbone data i 


dwishbone data 1 


17 


指令 Wishbone 总 


指令 Wishbone 44% 


民 Wishbone 总 
‘Ai; Wishbone } 
数据 Wishbone | 
i; Wishbone | 


|; Wishbone 


it Wishbone 总 线 输 出 


后 Wishbone 总 线 输出 





入 的 啊 应 


总 线 输入 的 数据 





N 一 


dwishbone ack 1 











it Wishbone 





总 线 输 入 的 响应 


12.4 实践 版 OpenMIPS 处 理 器 的 
实现 思路 
实现 思路 很 直观 : 将 教学 版 OpenMIPS 对 指令 存储 器 、 数 据 存储 器 


的 访问 信号 分 别 经 过 Wishbone 总 线 接 口 模块 ， 转 化 为 标准 的 Wishbone 总 
线 接口 信号 ， 即 可 。 如 图 12-11 所 示 。 


















































实践 版 OpenMIPS 
教学 版 OpenMIPS 
指令 接口 数据 接口 
Wishbone 总 线 Wishbone 总 线 
接口 模块 接口 模块 
上 令 Wishbone 总 线 接口 数据 Wishbone 总 线 接口 


图 12-11 实践 版 0penMIPS 处 理 器 的 实现 思路 


为 了 实现 实践 版 OpenMIPS， 需 要 对 教学 版 OpenMIPS 的 系统 结构 进 
行 修改 ， 主 要 修改 如 图 12-12 所 示 。 


















































































































CTRL 
sy? He LS 
K Be ROpenMIPS f 
kh k Op stallreq from if 
stallreq from mem 
etrl.v 
r | eo 
取 指 | Viti 
PC IF/ID | | MEM 
p if pi mem_data_i 
ce o if inst | Wishbone 总 线 接口 
pc_reg.v Wishbone 总 线 接口 | mem_addr_o | cpu_addr_i cpu_data_o 
a cpu addr i cpu_dat | mem ce_o >| cpu_ce i 
> cpu ce i if_id.v | mem_data_o —¥ cpu data i 
32'h00000006—»} cpu_data_i | mem_we_o | cpu_we i stallreq 
1'D0—> cpu_we_i stallreq mem sel o >| cpu sel i 
4b1111—> cpu sel | | clk wishbone_addr_o 
1 wishbone_addr_o | mem.v rst wishbone_data_o 
rst wishbone_data_o | stall_i wishbone_we_o 
stall i wishbone_we_o | flush_i wishbone_sel_o 
flush_i wishbone_sel_o wishbone_data_i wishbone_stb_o 
[> wishbone_data i  wishbone_stb_o | >| wishbone ack i wishbone_cyc_o 
P wishbone ack i wishbone_cyc “| | 
指令 Wishbone 总 线 接 口 数据 Wishbone 总 线 接口 


图 12-12 在 教学 版 0penMIPS 的 基础 上 进行 修改 ， 以 实现 实践 版 0penMIPS 
对 图 12-12 有 如 下 几 点 说 明 。 
(1) 主要 修改 了 流水 线 的 取 指 、 访 存 阶段 。 


(2) 在 取 指 阶段 添加 了 Wishbone 总 线 接口 模块 ， 使 得 PC 模块 给 出 
的 指令 存储 器 访问 信号 不 再 直接 连接 外 部 指令 存储 器 ， 而 是 经 过 
Wishbone 总 线 接口 模块 转化 为 Wishbone 总 线 接口 信和 号。 








(3) 由 于 指令 存储 器 是 只 读 的 ， 并 且 指 令 宽 度 固定 为 32 位 ， 所 以 
取 指 阶段 添加 的 Wishbone 总 线 接口 模块 的 输入 cpu_data_ i 直接 设置 为 
32'h00000000; cpu_we i 固定 为 10， 表 示 始 终 是 读 操 作 ; cpu_sel i 固定 
为 4b1111。 


(4) 添加 Wishbone 总 线 接口 后 ， 指 令 会 存储 在 FPGA 心 片 外 部 的 
Flash 中 ， 导 致 取 指 时 间 多 于 1 个 时 钟 周 期 。 在 指令 没有 取 到 时 ， 需 要 和 暂 
停 流 水 线 ， 所 以 在 取 指 阶段 添加 的 Wishbone 接 口 模块 有 一 个 输出 接口 


stalllreq， 连 接 到 CTRL 模 块 新 增加 的 输入 接口 stallreq_from_if， 该 信和 号 
表示 取 指 阶段 是 否 请 求 流水 线 暂 停 。 


(5) 在 访 存 阶段 也 添加 了 Wishbone 总 线 接口 模块 ， 使 得 MEM 模 块 
对 数据 存储 器 的 访问 信号 不 再 直接 连接 外 部 数据 存储 右 ， 而 是 经 过 
Wishbone 总 线 接口 模块 转化 为 Wishbone 总 线 接口 信和 号。 





(6) 添加 Wishbone 总 线 接 口 后 ， 数 据 会 存储 在 FPGA 疙 片 外 部 的 
SDRAM 中 ， 导 致 访问 数据 的 时 间 多 于 1 个 时 钟 周 期 。 在 数据 没有 访问 到 
时 ， 需 要 和 暂停 流水 线 ， 所 以 在 访 存 阶段 添加 的 Wishbone 接 口 模块 也 有 一 
个 输出 接口 stalllreq， 连 接 到 CTRL 模 块 新 增加 的 输入 接口 
stallreq_from_mem， 该 信号 表示 访 存 阶段 是 否 请 求 流水 线 暂 停 。 


125 ”从 教学 版 OpenMIPS 到 实践 
版 OpenMIPS 


12.5.1 Wishbone 总 线 接口 模块 的 实 
现 


Wishbone 总 线 接口 模块 的 作用 是 将 处 理 器 对 外 部 设备 的 访问 请 求 转 
化 为 Wishbone 总 线 信 号 ， 在 图 12-12 中 已 经 给 出 了 其 接口 示意 图 ， 有 具体 
描述 如 表 12-2 所 示 。 


表 12-2 Wishbone 总 线 接 口 模块 的 接口 描述 


复位 信号 


mA] 
ar PR CO E CTRL 模块 传 入 的 流水 线 暂 停 信号 

输入 来 自 处 理 器 的 数据 

e i i E \ 输出 到 处 理 器 的 数据 


wishbone addr o 3 输 Wishbone 总 线 输出 的 地 址 














wishbone data o Wishbone 总 线 输出 的 数据 


CE | 
a ECC [| ET 














本 节 将 采用 有 限 状 态 机 实现 Wishbone 总 线 接口 模块 ， 首 先 定义 三 
状态 : 空闲 状态 CWBLIDLE) , A AN (WB_BUSY) 、 os 


结束 状态 (WB_WAIT FOR_STALL) 。 这 三 个 状态 对 应 的 宏 定 义 在 
defines.v 文 件 中 定义 ， 如 下 。 





“define WB_IDLE 2'b00 // 空 闲 状态 
“define WB_BUSY 2'bo1 // 总 线 忙 状态 
“define WB WAIT FOR STALL ”2'b1i1 // 等 待 暂停 结束 状态 


三 个 状态 之 间 的 转化 关系 如 图 12-13 所 示 。 


处 理 器 发 起 了 访问 请 求 ， 且 当前 
不 是 处 于 流水 线 清 除 过 程 中 


复位 = = 
一 WB_IDLE 








WB_BUSY 








两 种 情况 之 一 : (1) 收 到 了 Wishbone 总 线 
的 响应 ， 且 流水 线 没有 处 于 暂停 状态 ， 








\ (2) 发 生 了 异常 ， 处 理 器 给 出 了 流水 线 清 
x 除 信号 rae . 
ER Br EN / 收 到 了 Wishbone 总 
流水 线 结束 暂停 、、 / 线 的 响应 ， 且 流水 
Nee S 线 处 于 暂停 状态 
SS 2 
ES WB_WAIT_FOR_STALL ao 











图 12-13 Wishbone 总 线 接口 模块 的 状态 机 


(1) 复位 的 时 候 进入 空闲 状态 WB_IDLE。 


(2) 当 处 于 空闲 状态 WB_IDLE 时 ， 如 果 处 理 器 发 出 了 访问 请 求 ， 
且 当 前 没有 处 于 流水 线 清除 过 程 中 ， 那 么 会 进入 总 线 忙 状态 


WB_BUSY， 开 始 访问 总 线 。 但 是 ， 如 果 处 于 流水 线 清除 过 程 中 ， 那 么 


本 次 的 总 线 访 问 当然 会 无 效 ， 所 以 不 必 进 入 WB_BUSY 状 态 


(3) 当 处 于 总 线 忙 状态 WB_BUSY 时 ， 如 果 收 到 Wishbone 总 线 的 





啊 应 ， 表 示 本 次 访问 结束 ， 此 时 需要 判断 流水 线 是 否 处 于 暂 俘 状态 。 


e 如 果 没 有 处 于 暂停 状态 ， 那 么 将 访问 到 的 数据 送 入 处 理 器 ， 进 
入 空闲 状态 wWB_IDLE， 等 待 下 一 次 访问 请 求 。 

e 如 果 人 处 于 暂停 状态 ， 那 么 将 访问 到 的 数据 暂时 保存 起 来 ， 同 时 
进入 等 待 暂停 结束 状态 WB_WAIT_FOR_STALL。 当 流水 线 暂 
停 结 束 时 ， 再 将 访问 到 的 数据 送 入 处 理 器 ， 并 且 进 入 空闲 状 态 
WB_IDLE， 等 待 下 一 次 访问 请 求 。 





(4) 当 处 于 总 线 忙 状态 WB_BUSY 时 ， 如 果 发 生 了 异常 ， 那 么 会 
清除 流水 线 ， 此 时 将 直接 取消 此 次 Wishbone 总 线 访问 ， 并 且 回 到 状态 
WB_IDLE. 


Wishbone 总 线 接 口 模块 的 代码 如 下 ， 源 文件 是 位 于 本 书 附带 光盘 
Code\Chapter12 目 录 下 的 wishbone_bus_if.v 文 件 中 。 


module wishbone_bus_if( 


input wire clk, 


input wire rst, 


// 来 自 ctr1 模 块 
input wire[5:0] stall_i, 


input wire flush_i, 


//CPU 侧 的 接口 
input wire cpu_ce_i, 


input wire[ RegBus] cpu_data_i, 




















cpu_data_o <= rd_buf; 
end 
default: begin 
end 
endcase 
end 


end 


endmodule 





上 述 代码 可 以 分 为 两 部 分 : 一 部 分 是 控制 状态 转化 的 时 序 电路 ， 
一 部 分 是 给 处 理 器 接口 信号 赋值 的 组 合 电路 。 分 别 解释 如 下 。 


(1) 控制 状态 转化 的 时 序 电路 


。 复位 的 时 候 进 入 WB_IDLE 状 态 ， 同 时 将 Wishbone 总 线 的 选 通 
信号 wishbone_stb 0、 周 期 选择 信号 wishbone_cyc_o 都 设置 为 
0 RAR 
{EWB_IDLERS F, WRAHA RV Ze (cpu_ce iX 

) ， 且 没有 处 于 流水 线 清除 过 程 中 (flush_i 为 False_v) ， 那 
么 会 进入 WB_BUSY 状 态 ， 同 时 Wishbone 总 线 的 选 通信 号 
wishbone_stb o、 周 期 选择 信号 wishbone_cyc_o 都 设置 为 1， 表 
示 开 始 Wishbone 总 线 访问 周期 。 要 访问 的 地 址 wishbone_addr _o 
就 是 输入 信号 cpu_addr i 的 值 ， 访 问 类 型 wishbone_we_o 束 是 输 
入 信号 cpu_we_i 的 值 ， 字 节选 择 信号 wishbone_sel _o 惑 是 输入 
信号 cpu_sel i 的 值 。 如 果 是 写 操作 ， 那 么 要 写 的 数据 
wishbone_data_o 就 是 输入 信号 cpu_data_i 的 值 。 
。 在 WB_BUSY 状 态 下 ， 如 果 收 到 Wishbone 总 线 的 响应 


(wishbone_ack_iW1) ， 那 么 设置 Wishbone 总 线 的 选 通信 和 号 
wishbone_stb o、 周 期 选择 信号 wishbone_cyc_o 都 为 0， 从 而 结 
束 Wishbone 总 线 访 问 周 期 。 如 果 是 读 操作 (cpu_we 为 
WriteDisable) ， 那 么 还 会 将 读 到 的 数据 保存 到 变量 rd_buf 中 。 
接 下 来 有 两 种 可 能 : 如 果 流 水 线 没 有 暂停 〈stall_i 等 于 
6b000000) ， 那 么 进入 空 亲 状态 WB_IDLE。 如 末 流 水 线 暂 停 
Cstall_j 不 等 于 6b000000) ， 那 么 进入 等 待 和 暂停 结束 状态 
WB_WAIT_FOR_STALL. 
在 WB_BUSY 状 态 下 ， 如 果 在 还 没有 收 到 Wishbone 总 线 的 响应 
时 ， 发 生 了 异常 ， 导 致 处 理 器 要 清除 流水 线 (flush i 为 
True v) ， 那 么 设置 Wishbone 总 线 的 选 通信 号 
wishbone_stb_o、 周 期 选择 信号 wishbone_cyc_o 都 为 0， 从 而 结 
束 总 线 访问 周期 。 同 时 ， 回 到 空闲 状态 WB_IDLE。 
。 在 等 待 暂 停 结 束 状态 WB_WAIT_FOR_STALL 下 ， 当 流水 线 暂 
停 结 束 时 〈stall_i 等 于 6b000000) ， 进 入 空 闪 状态 WB_IDLE。 





(2) 给 处 理 器 接口 信号 赋值 的 组 合 电路 


e 在 WB_IDLE 状 态 下 ， 如 果 处 理 器 要 访问 总 线 Ccpu_ce_iW 

1) ， 且 没有 处 于 流水 线 清除 过 程 中 (flush_i 为 False v) , AR 

么 需要 暂停 流水 线 以 等 待 此 次 Wishbone 总 线 访问 结束 ， 所 以 设 

置 输出 信号 stallreq 为 Stop。 

人 在 WB_BUSY 状 态 下 ， 如 果 收 到 Wishbone 总 线 的 啊 应 
(wishbone_ack i 为 1 ) ， 那 么 表示 此 次 访问 结束 ， 流 水 线 可 以 

继续 ， 所 以 设置 输出 信号 stallreq 为 NoStop。 如 果 是 读 操作 
(cpu_we_iXWriteDisable) ， 那 么 将 读 到 的 数据 

wishbone_data_i 通 过 cpu_data_o 接 口 送 给 处 理 器 。 


。 在 WB_BUSY 状 态 下 ， 如 果 没 有 收 到 Wishbone 总 线 的 啊 应 
(wishbone_ack i 不 为 1) ， 那 么 表示 此 次 访问 还 没有 结束 ， 流 
水 线 要 保持 暂停 ， 所 以 设置 输出 信号 stallreq 为 Stop。 
在 等 待 暂 停 结 束 状 态 WB_WAIT_FOR_STALL 下 ， 此 时 的 
Wishbone 总 线 访 问 已 经 结束 ， 所 以 设置 输出 信号 stallreq 为 
NoStop， 表 示 没 有 由 于 Wishbone 总 线 访问 导致 处 理 器 暂停 。 同 
时 ， 将 缓存 到 变量 rd_buf 的 数据 通过 cpu_data_o 接 口 送 给 人 处理 


Ba 


AN o 


12.5.2 ”修改 CTREL 模 块 


从 图 12-12 可 知 ， 实 际 例 化 了 两 个 Wishbone 总 线 接口 模块 ， 分 别 位 
于 流水 线 的 取 指 阶段 、 访 存 阶段 。 这 是 由 于 OpenMIPS 处 理 器 设计 采用 
哈佛 结构 ， 即 分 开 的 指令 、 数 据 总 线 。 两 个 模块 各 有 一 个 流水 线 和 暂停 请 
求 信 号 stallredq， 都 输出 到 CTRL 模 块 ， 分 别 表 示 取 指 阶段 请 求 流 水 线 暂 
停 、 访 存 阶段 请 求 流水 线 暂 停 ， 所 以 要 修改 CTRL 模 块 ， 添 加 部 分 接 
口 ， 如 表 12-3 所 示 。 


表 12-3 CTRL 模块 增加 的 接口 

















修改 CTRL 模 块 的 代码 如 下 ， 修 改 的 部 分 使 用 加 粗 、 和 斜体 标识 。 完 
整 代 码 请 参考 本 书 附带 光盘 中 Code\Chapter12 目 录 下 的 ctrlv 文 件 。 


module ctrl( 








end //always 


endmodule 





RA [FT JBL PATEAR ALAN A A, SEAT 


(1) OpenMIPS 采 用 的 是 一 种 改进 的 流水 线 暂 停机 制 : 假如 流水 线 
第 n 阶 段 请 求 流水 线 和 暂停 ， 那 么 需 使 取 指 令 地 址 PC 的 值 不 变 ， 同 时 保持 
流水 线 第 n 阶 段 、 第 n 阶 段 之 前 各 个 阶段 的 寄存 需 的 值 不 变 ， 而 第 n 阶 段 
后 面 的 指令 继续 运行 。 比 如 : 流水 线 执行 阶段 请 求 流水 线 和 暂停 ， 那 么 保 
持 PC 不 变 ， 保 持 取 指 、 译 码 、 执 行 阶段 的 寄存 器 不 变 ， 但 是 允许 访 
存 、 回 写 阶段 的 指令 继续 运行 。 





(2) CTRL 模 块 的 输出 信号 stall 古 一 个 宽度 为 6 的 信和 号， 其 含义 如 
下 ， 分 别 输出 到 流水 线 各 个 阶段 。 


stall[0] 表 示 取 指 地 址 PC 保持 不 变 。 
。 stall[1] 表 示 流 水 线 取 指 阶段 暂停 。 
。 stall[2] 表 示 流 水 线 译 码 阶段 暂停 。 
stall[3] 表 示 流 水 线 执 行 阶段 暂 集 。 
stall[4] 表 示 流 水 线 访 存 阶 段 暂 集 。 
e stall[5] 表 示 流 水 线 回 写 阶段 暂停 。 





理解 了 上 面 的 两 点 就 比较 容易 理解 我 们 对 CTRL 模 块 的 修改 了 ， 还 
征 分 取 指 、 访 存 两 种 情况 解释 。 


(1) 如 果 是 访 存 阶段 请 求 暂停 ， 那 么 除 回 写 阶段 外 ， 其 余 各 阶段 
都 要 和 暂停， 所 以 设置 stall] 为 6b011111。 


(2) 如 果 是 取 指 阶段 请 求 暂 停 ， 那 么 理论 上 应 该 只 暂停 取 指 阶 
段 、 保 持 PC 不 变 ， 也 就 是 设置 stall 为 6b000011， 但 是 上 面 CTRL 模 块 的 
代码 将 stall 设 置 为 6b000111， 使 得 流水 线 译 码 阶段 也 暂停 ， 这 么 做 ， 主 
要 是 考虑 到 一 种 特殊 情况 : 假设 译 码 阶段 的 指令 是 转移 指令 ， 那 么 此 时 
取 指 阶段 将 要 取 到 的 指令 就 是 延迟 槽 指令 ， 将 译 码 阶段 也 和 暂停， 保持 了 
转移 指令 与 延迟 槽 指令 在 流水 线 中 的 相对 位 置 ， 从 而 能 够 正确 识别 出 延 
述 模 指令， 如 图 12-14 所 示 。 如 果 取 指 阶段 暂停 ， 而 不 使 译 码 阶段 暂 
停 ， 那 么 转移 指令 会 在 下 一 周期 进入 执行 阶段 ， 同 时 在 译 码 阶段 会 填充 
空 指令 ， 这 样 就 使 得 填充 的 空 指令 被 误 认 为 是 延迟 槽 指令， 从 而 出 错 ， 
如 图 12-15 所 示 。 






























































取 指 PEN 执行 访 存 回 写 
时 刻 T >< 转移 指令 > ho dl la al > 
SI 转移 指令 O be > dl `> 
ss 一 SS -一 E „= = JF ~、 u 
时 刻 THm KO 指令 取 到 < 转移 指令 > le. > <a = 
时 刻 Ttm K< > Halt > 转移 指令 KT D > 
Wea sida een 
EE aL A A EI TS > 
2912-14 取 指 、 译 码 阶 段 同 时 暂停 ， 从 而 正确 识别 延迟 槽 指令 
取 指 译 码 执行 访 存 回 写 
时 刻 T 取 指 暂停 OK 转移 指令 站 > AK > 
时 刻 T+1 Kehren > NOP > 转移 指令 OC le > 
\ = 
\ 
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GEA NY AH A 


912-155 取 指 阶段 暂停 ， 译 码 阶 段 没有 暂停 ， 会 错误 识别 延迟 模 指 令 


12.5.3 ”修改 OpenMIPS 顶 层 模 块 


因为 添加 了 Wishbone 总 线 接口 模块 ， 所 以 需要 修改 OpenMIPS 顶 层 
模块 ， 在 其 中 例 化 Wishbone 总 线 接口 模块 ， 并 按照 图 12-12 所 示 将 其 和 
其 他 模块 连接 起 来 ， 有 具体 代码 不 在 书 中 罗列 ， 读 者 可 以 参考 本 书 附 融 光 
盘 Code\Chapter12 目 录 下 的 openmips.v 文 件 。 


12.6 ”实践 版 OpenMIPS 人 处 理 妖 实 
N 


本 章 在 教学 版 OpenMIPS 处 理 器 的 基础 上 ， 通 过 添加 Wishbone 总 线 
接口 模块 ， 实 现 了 实践 版 OpenMIPS 处 理 器 ， 这 样 我 们 的 OpenMIPS 处 理 
器 就 可 以 方便 地 使 用 现在 已 有 的 大 量 开 源 IP 核 ， 包 括 SDRAM 控 制 器 、 
Flash 控 制 器 、UART 控 制 器 等 ， 从 而 可 以 快速 搭建 一 个 实用 的 SOPC。 








在 第 13 章 ， 就 将 基于 实践 版 OpenMIPS 处 理 器 构建 一 个 小 型 SOPC， 
该 SOPC 可 以 下 载 实际 的 FPGA 开 发 板 上 ， 用 来 检验 实践 版 OpenMIPS 处 
理 器 是 否 实现 正确 。 


第 13 草 ”基于 实践 版 0penMIPS 的 小 
型 SOPC 


第 12 章 通过 为 教学 版 OpenMIPS 处 理 器 添加 Wishbone 总 线 接口 实现 
了 实践 版 OpenMIPS 处 理 器 ， 但 是 没有 经 过 验证 ， 本 章 将 基于 实践 版 
OpenMIPS 搭 建 一 个 小 型 SOPC， 下 一 章 将 以 其 为 平台 ， 运 行 验 证 程序 ， 
以 检验 实践 版 OpenMIPS 处 理 器 是 否 实现 正确 。 





本 章 搭 建 的 小 型 SOPC 包 括 GPIO 模 块 、UART 控 制 器 、Flash 控 制 
器 、SDRAM 控 制 器 等 ， 这 些 控 制 器 与 OpenMIPS 处 理 器 都 连接 到 
Wishbone 总 线 互联 窍 阵 上 ， 本 章 13.3 至 13.6 节 将 分 别 介 绍 这 些 控制 器 。 


13.1 小 型 SOPC 的 结构 


实践 版 OpenMIPS 处 理 喜 与 其 余 各 种 控制 器 都 是 通过 Wishbone 总 线 
连接 在 一 起 的 ，Wishbone 总 线 有 四 种 互联 方式 : 点 对 点 、 数 据 流 、 共 享 
As 交叉 互联 。 在 点 对 点 方式 中 ， 一般 只 有 一 个 主 设备 、 一 个 从 设 
备 ， 但 是 对 于 一 个 片上 系统 而 言 ， 一 般 存 在 多 个 模块 ， 并 且 某 一 模块 能 
够 访问 其 余 多 个 模块 ， 比 如 存在 CPU、DMA 控 制 器 、Flash 控 制 器 、 
SDRAM 控 制 器 、GPIO 等 ， 其 中 CPU、DMA 控 制 器 作为 主 设备 ，Flash 
控制 器 、SDRAM 控 制 器 、GPIO 作 为 从 设备 ， 主 设备 CPU 可 以 访问 所 有 
的 从 设备 ， 主 设备 DMA 控 制 器 也 可 以 访问 所 有 的 从 设备 ， 当 两 者 对 同 
一 设备 发 出 访问 请 求 时 ， 就 需要 一 个 仲裁 机 制 来 判断 哪个 主 设备 占用 总 
线 ， 所 以 ， 片 上 系统 一 般 使 用 共享 总 线 或 者 交叉 互联 方式 。 分 别 介绍 如 
i 








1. 共享 总 线 


向 








共享 总 线 方式 适合 于 系统 中 有 两 个 或 者 多 个 主 设备 需要 与 一 个 或 者 
多 个 从 设备 通信 的 情况 ， 它 们 通过 共享 的 总 线 进 行 通 信 。 主 设备 在 需要 
与 一 个 从 设备 通信 时 ， 需 要 和 驳 同 仲裁 器 申请 总 线 占 有 权 ， 获 得 允许 后 开 
始 占用 总 线 并 与 目标 从 设备 开始 通信 ， 通 信和 结束 后 释放 总 线 。 当 多 个 主 
设备 同时 希望 占有 总 线 时 ， 仲 裁 器 通过 一 定 的 优先 级 逻辑 分 配 总 线 使 用 
机 会 。 其 典型 框图 如 图 13-1 所 示 。 共 至 总 线 的 缺点 是 同一 时 刻 只 能 有 一 
对 主 、 从 设备 建立 通信 。 


2. CNA 


交叉 互联 主要 使 用 在 多 个 主 设备 同时 访问 多 个 从 设备 的 情况 ， 其 典 
型 框图 如 图 13-2 所 示 。 在 这 种 连接 方式 下 ， 主 设备 发 出 对 某 个 从 设备 的 
访问 请 求 ， 仲 裁 器 查看 总 线 和 从 设备 是 否 空 间 ， 从 而 决定 是 否 给 主 设备 
总 线 访问 权 。 交 叉 互 联 方式 允许 多 对 主 设备 和 从 设备 同时 进行 通信 ， 而 
共享 总 线 方式 在 同一 时 刻 只 允许 一 对 主 、 从 设备 进行 通信 。 
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从 设备 A 从 设备 B 从 设备 C 























图 13-1 共享 总 线 方式 
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从 设备 A 从 设备 B 从 设备 C 





























图 13-2 ”交叉 互联 方式 


本 章 建 立 的 小 型 SOPC 使 用 的 就 是 交叉 互联 方式 ， 其 结构 如 图 13-3 
所 示 。 在 Wishbone 总 线 上 挂 接 了 五 个 模块 : 实践 版 OpenMIPS 处 理 器 、 
GPIO、UART 控 制 器 、Flash 控 制 器 、SDRAM 控 制 器 。 其 中 Wishbone 总 
线 使 用 的 是 OpenCores 站 点 提供 的 开源 项 目 WB_CONMAX， 这 是 一 个 
Wishbone 总 线 互联 窍 阵 ， 采 用 的 是 交叉 互联 方式 ， 人 允许 多 对 主 从 设备 同 
时 进行 通信 。 

















OpenMIPS 
数据 总 线 指令 总 线 
Wishbone 总 线 
/\ 
\ WB_CONMAX J 





SDRAM 控 制 器 | | UART 控 制 器 GPIO Flash 控 制 器 


| l l | 


SDRAM 芯 片 9 针 串 行 接口 LED, FX, Flashi) 
图 13-3 “小 型 SOPC 的 结构 











13.2 “Wishbone 总 线 互联 矩阵 
WB _CONMAX 


读者 可 以 使 用 SVN 从 
http:Wopencores.org/ocsvn/wb_conmax/wb_conmax 下 载 得 到 最 新 的 
WB_CONMAX 的 代码 ， 下 载 前 需要 首先 在 OpenCores 站 点 注册 ， 下 载 的 
时 候 输 入 在 OpenCores 站 点 注册 时 的 用 户 名 和 密码 。 也 可 以 在 本 书 光 盘 
Code\Chapterl13\wb_conmax 目 录 下 找到 所 有 代码 。WB_CONMAX 模 块 
有 如 下 特点 。 





e 支持 8 个 Wishbone 总 线 主 设备 。 

。 支持 16 个 Wishbone 总 线 从 设备 。 

。 内 置 仲裁 器 ， 文 持 1、2 或 4 个 优先 级 。 
e 人 允许 多 对 主 从 设备 同时 相互 通信 。 

e 支持 WishboneB2 版 本 。 


WB_CONMAX 模 块 的 结构 如 图 13-4 所 示 。 主 设备 选择 从 设备 进行 
通信 时 ， 依 据 主 设备 提供 的 Wishbone 地 址 的 高 4 位 确定 是 选择 哪 一 个 从 
设备 进行 通信 ， 当 地 址 高 4 位 为 0 时， 选择 的 就 是 从 设备 0， 当 地 址 高 4 位 
为 15 时 ， 选 择 的 就 是 从 设备 15。 所 以 每 个 从 设备 的 寻 址 空间 大 小 都 是 
256M， 其 中 从 设备 0 的 寻 址 空间 是 0x00000000-0x0FFFFFFF。 本 章 建 立 
的 小 型 SOPC 中 各 个 模块 与 VB_CONMAX 的 连接 如 图 13-5 所 示 。 












































































































































































































































4 从 设备 接口 0 上 二 一 
设备 接口 0 一 a / 
Ne St Mina 上 二 一 
Nor So Ta 
主 设备 接口 E 入 实践 版 
\ VER OpenMIPS 
Ar A ABER ae 指令 总 线 
Serasi X? > > Wishbone Hk 
NW X haste / 主 设备 设备 
yA NA | 接口。 u WB_CONMAX PA 
o N \ 从 设备 从 设备 ie 从 设备 || 
N \ #00 接口 1 接口 2 接口 3 
SN 从 设备 接口 15 [一 | | | | | 
SDRAM 控 制 器 UART 控 制 器 GPIO Flash 控 制 器 
图 13-4 WB_CONMAX 模 块 的 结构 图 图 13-5 ”小 型 SOPC 中 各 个 模块 与 WB_CONMAX 
的 连接 关系 图 


OpenMIPS 具 有 分 开 的 指令 、 数 据 接口 ， 所 以 占用 WB_CONMAX 两 
个 主 设备 接口 ， 其 中 数据 接口 连接 到 主 设备 接口 0， 指 令 接 口 连接 到 主 
设备 接口 1。 


SDRAM 控 制 器 连接 到 从 设备 接口 0(、UART 控 制 器 连接 到 从 设备 接 
口 1、GPIO 连 接 到 从 设备 接口 2、Flash 控 制 器 连接 到 从 设备 接口 3。 所 以 
上 述 各 个 外 设 的 寻 址 空间 如 表 13-1 所 示 。 


表 13-1 小 型 SOPC 中 各 个 外 设 的 寻 址 空间 





名 称 寻 址 空间 


一 个 实用 的 片上 系统 通常 将 程序 放置 在 Flash 中 ， 系 统 启动 后 从 
Flash 读 取 第 一 条 指令 ， 从 表 13-1 可 知 ，Flash 对 应 的 是 从 地 址 0x30000000 
开始 的 256M 字 节 空 间 ， 所 以 需要 修改 实践 版 OpenMIPS 人 处理 器 ， 使 得 其 
在 复位 结束 后 从 地 址 0x30000000 处 开始 取 指 。 只 需要 修改 取 指 阶段 的 
PC 模块 即 可 实现 此 目的 ， 主 要 修改 如 下 ， 完 整 代码 请 读者 参考 本 书 附 
带 光 盘 Code\Chapter13\OpenMIPS 目 录 下 的 pc_reg.v 文 件 。 





13.3 GPIO 


GPIO (General Purpose Input Output) 是 以 位 为 单位 进行 数字 输入 
输出 的 VO 接口 ， 作 为 单纯 的 通用 输入 /输出 VO， 输 入 时 从 外 部 读 取 输 入 
言 号 ， 输 出 时 将 写 入 的 值 输出 到 外 部 。 处 理 器 通过 GPIO 可 以 与 各 种 设 
备 相 连接 ， 例 如 : LED、 开关、 七 段 数码 管 等 。 


本 章 建 立 的 小 型 SOPC 将 直接 使 用 OpenCores 站 点 提供 的 开源 项 目 
GPIO IP Core， 读 者 可 以 在 OpenCores 站 点 下 载 源 代 码 ， 也 可 以 直接 在 本 
书 附带 光盘 Code\Chapterl13\gpio 目 录 下 找到 所 有 源 代 码 。 在 本 书 附带 光 
盘 中 Doc 目 录 下 提供 了 该 GPIO 的 说 明 手 册 。 其 具有 如 下 特点 。 





IO 接口 数量 从 1 到 32 可 配置 。 

e 所 有 的 W/O 接口 都 可 以 配置 为 双 问 接口 。 

输入 接口 可 以 触发 中 断 。 

。 具有 复 用 输入 接口 ，GPIO 最 终 的 输出 信号 可 以 是 Wishbone 总 
线 接口 的 输入 信号 ， 也 可 以 是 复 用 输入 接口 的 信号 。 

。 可 以 采用 Wishbone 总 线 的 时 钟 ， 也 可 以 采用 单独 的 时 钟 。 

3¢#FWishbone B 版 本 《手册 中 未 明确 说 明 是 哪个 版 本 ， 从 接口 

情况 分 析 ， 可 能 是 B2 版 本 ) o 





接口 描述 如 表 13-2 所 示 。 


表 13-2 GPIO 1P 核 的 外 部 接口 描述 


e | 接口 名 输入 /输出 
i 输入 Wishbone 总 线 时 钟 信号 
输入 Wishbone 总 线 复位 信号 





输入 Wishbone 总 线 周 期 信和 号 








输入 Wishbone 总 线 输入 的 地 址 

e jem a a | Wishbone 总 线 输入 的 数据 

ls [wwe: J1 | 输 Wishbone 总 线 写 使 能 信和 号 
7 4) 


Wishbone 总 线 字 节 选择 信和 号 


u ja | 
wi I | 
en | 出 Wishbone 总 线 输出 的 数据 
CU fe 
a [ás 
EE 


Wishbone 总 线 选 通信 和 号 








a lams | si | Wishbone £12246 if IEW 











GPIO ”IP 核 的 功能 是 通过 配置 一 系列 寄存 器 实现 的 ， 主 要 的 寄存 器 
如 表 13-3 所 示 。 


表 13-3 GP10 1P 核 中 的 主要 寄存 器 


seno [ee Tee | wane [a 





RGPIO OUT x 读 可 写 GPIO 输出 的 信号 
RGPIO_OE | 读 可 写 GPIO 输出 接口 使 能 信号 
RGPIO INTE 读 可 写 中 断 使 能 信和 号 














其 中 地 址 一 栏 中 的 Base 就 是 GPIO 的 基地 址 ， 从 图 13-5 可 知 ， 小 型 
SOPC 中 的 GPIO 挂 接 在 从 设备 接口 2， 因 此 GPIO 对 应 的 地 址 空间 是 
0x20000000-0x2FFFFFFF， 所 以 表 13-3 中 的 Base 就 等 于 0x20000000， 这 
样 就 可 以 知道 各 个 寄存 器 的 确切 地 址 了 ， 例 如 : RGPIO_OUT 寄 存 器 的 
地 址 就 是 0x20000004。 对 其 中 的 RGPIO_OE、RGPIO_INTE 两 个 寄存 器 
解释 如 下 。 


(1) RGPIO_OE 





宽度 为 1~32 可 选 ， 当 某 一 位 为 1 时 ， 相 应 的 输出 接口 使 能 ， 当 某 一 
位 为 0 时 ， 相 应 的 输出 接口 为 三 态 或 open-drain 模 式 。 复 位 的 时 候 ， 所 有 
位 都 为 0。 








(2) RGPIO_INTE 





宽度 为 1~32 可 选 ， 当 某 一 位 为 1 时 ， 相 应 的 输入 接口 能 产生 中 断 ， 
当 某 一 位 为 0 时 ， 相 应 的 输入 接口 不 能 产生 中 断 。 复 位 的 时 候 ， 所 有 位 
都 为 0。 





GPIO IP 核 由 gpio_defines.v、gpio_top.v 两 个 文件 组 成 。 其 中 
gpio_defines.v 文 件 有 一 些 宏 定 义 需 要 配置 ， 目 的 是 使 得 输入 、 输 出 接口 
的 宽度 都 是 2， 如下。 











//I0 接 口 的 数量 ， 可 以 配置 的 范围 是 1-32， 默 认 是 31， 此 处 改 为 32 
“define GPIO_IOS 32 








// 与 I0 接 口 数 量 要 对 应 ， 默 认 是 31， 此 处 也 改 为 32 
“define GPIO_LINES 32 





// 将 下 面 的 宏 定 义 注 释 掉 ， 表 示 没 有 复 用 输入 接口 ， 也 就 是 没有 表 13 -2 中 的 aux_i 接 口 
//~ define GPIO_AUX_IMPLEMENT 


// 在 小 型 SOPC 中 ，GPIO 模 块 的 时 钟 采用 的 是 Wishbone 总 线 的 时 钟 ， 所 以 将 下 面 的 宏 定 , 
// 表 示 没 有 外 部 时 钟 输入 接口 ， 也 束 是 没有 表 13-2 中 的 clk_pad_i 接 口 
// define GPIO CLKPAD 





13.4 UART# il] 28 


13.4.1 UARTIHS) 


UART 即 通用 异步 收发 器 (Universal Asynchronous 
Receiver/Transmitter) ， 是 广泛 使 用 的 串 行 数据 传输 协议 。 它 的 功能 是 
将 并 行 的 数据 转变 为 串 行 的 数据 发 送 或 者 将 接收 到 的 串 行 数据 转变 为 并 
行 数据 。 当 本 章 设计 的 小 型 SOPC 有 具备 了 UART 控 制 器 之 后 ， 残 可 以 通 
过 串口 与 计算 机 进行 通信 了 。 


UART 产 生 于 20 世 纪 70 年 代 ，Intel ”8250 是 第 一 代 产 品 ， 被 使 用 在 
IBM-PC 及 其 兼容 机 上 ， 用 于 与 Modem 或 串 行 打 印 机 进行 通信 ， 随 着 PC 
的 成 功 和 迅速 普及 ， 确 定 了 UART 的 结构 和 特性 ， 经 过 8250A、16450、 
16C451、16550， 逐 步 发 展 到 16550A。16550A 与 用 于 8250 的 软件 兼容 ， 
但 是 提供 了 更 高 的 性 能 ， 其 性 能 增强 的 关键 是 使 用 了 先进 先 出 堆栈 
(FIFO〉 作 为 缓存 ， 配 置 了 16 字 节 的 发 送 FIFO 和 16 字 节 的 接收 FIFO。 
之 后 虽然 也 有 新 的 UART 出 现 ， 但 是 从 内 部 结构 分 析 ， 实 际 都 是 在 
16550 的 基础 上 增加 了 寄存 器 ， 从 软件 角度 分 析 ， 变 化 并 不 大 。 因 此 ， 
16550 是 实际 上 的 工业 标准 UART， 分 为 A、B、C、D 共 4 种 型 号 。 


下 面 分 别 介绍 UART 数 据 传 输 、 数 据 接收 、 流 控制 的 基本 过 程 。 
(1) UART 的 数据 传输 


UART 在 传输 的 时 候 ， 将 每 传输 数据 的 每 个 字符 一 位 一 位 地 传输 。 
传输 格式 如 图 13-6 所 示 。 


< 数据 位 











> 
Kan rt eV, AS SS Z AAN os | 
¡E NESBA, ¿A XMSBX wt > Bub 


¿Ha 收发 状态 > < 一 空闲 








图 13-6 UART 的 数据 传输 格式 
依次 传输 起 始 位 、 数 据 位 、 奇 偶 校 验 位 、 停 止 位 ， 分 别 说 明 如 下 。 
起 始 位 : ” 先 发 出 一 个 低 电 平 信号 ， 也 就 是 逻辑 *0”， 表 示 传 输 的 开 


数据 位 : ” 紧 接着 起 始 位 之 后 的 是 数据 位 。 数 据 位 的 个 数 可 以 是 4、 
5、6、7、8 等 ， 构 成 一 个 字符 ， 从 字符 的 最 低位 开始 传送 。 





奇偶 校 验 位 : ”数据 位 之 后 是 奇偶 校 验 位 。 数 据 位 加 上 这 一 位 后 ， 
使 得 “1” 的 个 数 为 偶数 〈 侦 校 验 ) 或 奇数 〈 奇 校 验 ) ， 以 此 来 判断 数据 
传送 的 正确 与 否 。 


停止 位 。 是 一 个 字符 数据 的 结束 标志 ， 可 以 是 1 位 、1.5 位 、2 位 的 
高 电 平 信号 。 


UART 的 通信 速率 用 波 特 率 (baud rate) Kr. REITEN Fels 
号 被 调制 以 后 的 变化 率 ， 即 单位 时 间 内 载波 变化 的 次 数 。 用 于 波 特 率 计 
算 的 信号 除了 数据 位 ， 还 包括 起 始 位 、 奇 偶 校 验 位 、 停 止 位 ， 因 此 ， 泌 
特 率 与 单纯 的 数据 传输 速率 是 不 同 的 。UART 常 用 的 波 特 紊 有 9600 
baud, 19200 baud, 38400 baud 等 。 





(2) UART 的 数据 接收 


UART 的 数据 接收 部 分 采用 比 波 特 紊 高 的 采样 频率 实现 。 实 际 使 用 
中 ， 一 般 使 用 比 波 特 率 高 16 倍 的 接收 时 钟 进行 采样 。 为 了 便于 说 明 ， 图 





13-7 以 接收 时 钟 是 波 特 率 的 4 倍 为 例 ， 给 出 了 数据 接收 过 程 。 





接收 信号 \ | 起 la LSB TS ee MSB arr 停止 
se UU 
@ (b) © (d) (d) (9) 


图 13-7 UART 的 数据 接收 过 程 











Ca) 当 接 收 信和 号 由 高 电 平 变 为 低 电 平时 ， 表 示 检 调 到 起 始 位 。 





Cb) 检测 到 起 始 位 后 ， 在 接 下 来 的 第 2 个 时 钟 周期 检查 接收 信和 号 ， 
如 果 保 持 为 低 电 平 ， 说 明确 实 是 起 始 位 ， 开 始 接收 数据 。 人 否则 认为 起 始 
位 检测 错误 ， 将 其 忽略 。 


(c) 确定 是 起 始 位 后 ， 等 待 4 个 时 钟 周 期 检查 接收 信号 ， 得 到 的 值 
就 是 接收 到 的 第 一 个 bit， 也 就 是 LSB。 


Cd) 之 后 每 隔 4 个 时 钟 周期 检查 接收 信号 ， 依 次 得 到 传送 过 来 的 数 
据 位 、 奇 偶 校 验 位 。 从 图 中 可 以 发 现 ， 每 次 采样 都 是 在 接收 数据 的 中 
部 ， 这 样 采 样 得 到 的 数据 更 加 准确 。 


Ce) 数据 接收 完成 后 ， 接 收 停止 位 。 
(3) 流 控制 


数据 在 两 个 UART 之 间 传 输 时 ， 管 第 会 出 现 丢 失 数 据 的 现象 ， 比 
如 : 两 台 PC 的 处 理 速度 不 同 ， 如 果 接 收 方 数据 缓冲 区 己 满 ， 那 么 此 时 
继续 发 送 来 的 数据 就 会 于 失 ， 特 别 是 使 用 PC 机 与 Modem 进 行 数据 传输 
时 ， 这 个 问题 尤为 突出 ， 流 控制 就 是 用 于 解决 这 个 问题 的 。 当 接收 方 数 
据 处 理 不 过 来 时 ， 惑 发 出 “不 再 接收 ?的 信号 ， 发 送 方 则 停止 发 送 ， 直 到 
收 到 “可 以 继续 发 送 ” 的 信号 再 发 送 数据 ， 因 此 流 控制 可 以 控制 数据 传输 








进程 ， 防 止 数 据 丢 失 。UARIT 第 用 的 两 种 流 控 制 是 便 件 流 控 制 和 软件 流 
控制 。 





对 人 硬件 流 控制 进行 简单 介绍 。 引 入 了 两 对 握手 信号 RTS/CTS、 
DTR/DSR。 第 一 对 握手 信号 是 RTS 和 CTS， 当 接收 方 准 备 好 接收 数据 
时 ， 将 RTS 置 高 ， 表 示 它 准备 好 了 ， 如 果 发 送 方 也 就 绪 ， 那 么 置 高 
CTS， 表 示 它 即将 发 送 数 据 。 第 二 对 握手 信号 是 DTR 和 DSR， 主 要 用 于 
Modem 通 信 。 例 如 : 当 Modem 已 经 准备 好 接收 来 自 PC 的 数据 时 ， 就 置 
高 DTR， 表 示 和 电话 线 的 连接 已 经 建立 。 如 果 DSR 线 置 高 ， 那 么 PC 将 开 
始 发 送 数据 。 一 个 简单 的 规则 是 DTR/DSR 用 于 表示 系统 通信 就 绊 ， 而 
RTS/CTS 用 于 单个 数据 包 的 传输 。 














13.4.2 UART16550 IP 核 介绍 


本 章 建 立 的 小 型 SOPC 采 用 的 UART 控 制 器 是 OpenCores 站 点 提供 的 
开源 项 目 UART16550 IP Core， 读 者 可 以 在 OpenCores 站 点 下 载 源 代码 ， 
也 可 以 直接 在 本 书 附带 光盘 Code\Chapter13\uart 目 录 下 找到 所 有 源 代 
码 。 该 卫 核 具有 如 下 特点 。 





。 最 大 程度 的 兼容 国家 半导体 公司 (National Semiconductor) 的 
16550A 设 备 。 

e 文 持 Wishbone BIKA. 

e Wishbone 接 口 侧 的 数据 总 线 宽度 可 以 设置 为 32 或 者 8。 


其 接口 可 以 分 为 三 部 分 ， 分 别 如 表 13-4、 表 13-5、 表 13-6 所 示 。 


#13-4 UART16550 1P 核 的 Wi shbone 接 口 信 号 


CCIE TE TT a mn 
cree rt fi Wishbone 总 线 复位 信号 
3 rb cyc i Wishbone 总 线 周期 信 
4 Wishbone 总 线 输入 的 地 址 
4 Wishbone 总 线 输入 的 数据 
Wishbone 总 线 写 使 能 信号 


ICONO ET ACTO en — 
Wishbone 总 线 输出 的 数据 
Wishbone 总 线 输出 的 响应 


表 13-5 UART16550 1P 核 的 中 断 信号 

















输入 /输出 


输出 





as ana [a | a ER 


RTS (Request To Send) 请 求 发 送信 和 号 





cts pad i CTS (Clear To Send) 清除 发 送信 号 





dtr pad o fan tL DTR (Data Terminal Ready) 数据 终端 准备 好 信和 号 
dsr pad i DSR (Data Set Ready) 数据 准备 好 信和 号 





RI (Ring Indicator) 振 铃 指示 信和 号 
DCD (Data Carrier Detect) 数据 载波 检测 信和 号 


i, frit 波 特 率 输出 信号 ， 其 频率 是 实际 波 特 率 的 16 
baud o mi ee 
倍 ， 该 信号 是 可 选 的 

















同 GPIO 一 样 ，UART16550 IP 核 的 功能 也 是 通过 配置 一 系列 寄存 器 


实现 的 ， 如 表 13-7 所 示 。 


表 13-7 UART16550 1P 核 中 的 寄存 器 


OS feia 


Receiver Buffer Base + 0x0 8 接收 缓冲 





Transmitting Holding Register (THR) Base + 0x0 AS 发 送 保持 


Interrupt Enable Register 
Interrupt Identification 








> = 

E 

| 

其 中 地 址 一 栏 中 的 Base 就 是 UART 控 制 器 的 基地 址 ， 从 图 13-5 可 

知 ， 小 型 SOPC 中 的 UART 控 制 器 挂 接 在 从 设备 接口 1!， 因 此 UART 控 制 
器 对 应 的 地 址 空间 是 0x10000000-0x1FFFFFFF， 所 以 表 13-7 中 的 Base 就 
等 于 0x10000000， 于 是 便 可 以 知道 各 个 寄存 器 的 确切 地 址 。 除 了 表 13-7 
中 列 出 的 寄存 器 之 外 ， 还 有 两 个 寄存 器 ， 组 成 一 个 16bit 的 分 频 系数 ， 用 
于 时 钟 分 频 ， 如 表 13-8 所 示 。 











#13-8 UART16550 1P 核 中 的 分 闫 系数 寄存 器 


ran i 访 








Divisor Latch Byte 1 Base + 0x0 ER]? 
Divisor Latch Byte 2 Base + 0x1 可 读 可 写 


读者 朋友 可 能 注意 到 ， 此 处 两 个 分 频 系数 寄存 器 的 地 址 与 表 13-7 中 
的 寄存 器 有 冲突 ， 解 决 方法 是 ， 当 Line Control Register (LCR) 寄存 器 
的 第 7bit 为 1 时 ， 地 址 Base + 0x0, base + 0x1 对 应 的 就 是 两 个 分 频 系 数 寄 
存 器 ， 反 之 ， 对 应 的 是 表 13-7 中 的 寄存 器 。 


本 书 在 第 14 章 验证 小 型 SOPC 的 时 候 ， 没 有 使 用 UART16550 IP 核 的 
流 控制 等 功能 ， 只 是 使 用 了 简单 的 数据 发 送 、 接 收 功 能 ， 因 此 只 对 与 数 
据 发 送 、 接 收 有 关 的 寄存 器 进行 说 明 ， 其 余 寄存 器 的 说 明 可 以 参考 本 书 
附带 光盘 Doc 目 录 下 UART16550 IP 核 的 使 用 手册 。 需 要 说 明 的 寄存 器 是 


Interrupt Enable Register (IER) 、Line Control Register (LCR) 、Line 
Status (LS) 、 分 频 系数 寄存 器 。 


(1) IER 





HET (SE a OR CE ARA, SEHE 8022 13-9 PI 





#13-9 IERF BR 


Transmitting Holding Register 空 中 断 : 0 一 一 禁止 ;1 
使 能 





LCR 寄 存 器 用 来 设置 接收 、 发 送 的 数据 格式 。 各 位 的 作用 如 表 13- 
10 所 示 。 


表 13-10 ”LCR 寄存 器 


位 作用 描述 
| 


>| 


数据 位 长 度 : 














00 5 位 
01 6 位 
10 7 位 
11 8 位 


停止 位 长 度 : 

0 1 位 停止 位 

re aa a a a 
TA, 


校 验 位 : 
0 一 一 无 校 验 
1 一 一 有 校 验 


校 验 类 型 : 
0 一 一 奇 校 验 


1 一 一 偶 校 验 


添加 奇偶 校 验 位 : 
0 一 一 茶 止 添加 奇偶 校 验 位 
1 一 一 使 能 添加 奇偶 校 验 位 


间断 控制 位 : 
0 一 一 不 使 用 间 靳 
1 一 一 串 行 输出 固定 在 逻辑 0 


分 频 系数 寄存 器 访问 位 ; 
0 一 访问 正常 寄存 器 
1 一 访问 分 频 系数 寄存 器 





(3) LS 


LS 寄存 器 用 来 指示 发 送 和 接收 的 状态 ， 各 个 位 的 作用 如 表 13-11 所 


表 13-11 LS 寄存 器 


接收 数据 标志 : 
1 一 一 接收 FIFO 不 为 空 
0 一 一 接收 FIFO 为 空 


接收 FIFO 溢 出 标志 : 

1 一 一 FIFO 满 并 且 接 收 移 位 寄存 器 正在 接收 新 数据 。 
读 LS 寄 存 器 后 ， 会 自动 清除 该 位 

0 一 ”接收 FIFO 没 有 溢出 


校 验 错误 标志 : 

1 一 一 FIFO 顶 部 的 字 节 有 校 验 错误 。 读 LS 寄存 右 后 ， 
会 自动 清除 该 位 

0 一 一 当前 字 节 没有 校 验 错误 


帧 错误 标志 : 

1 一 一 FIFO 顶 部 字 节 有 帧 错误 。 读 LS 寄存 器 后 ， 会 自 
动 清 除 该 位 

0 当前 字 节 没有 帧 错误 


间断 中 断 标志 : 

]- ”当前 字 节 有 间断 错误 。 当 串 行 接收 信号 保持 一 段 
时 间 的 逻辑 0 时 ， 认 为 发 生 间 上 断 错误 ， 此 时 写 一 个 0 字 
节 到 FIFO。 读 LS 寄存 器 后 ， 会 自动 清除 该 位 

0 一 一 当前 字 节 没有 间断 错误 

















发 送 FIFO 空 标志 : 

1] 一 一 THR 寄 存 器 为 空 ， 但 是 发 送 移 位 寄存 器 不 为 空 。 
在 这 种 情况 下 ， 会 产生 THR 空 中 断 。 向 发 送 FIFO 写 入 
数据 后 ， 会 自动 清除 该 位 

0 一 一 其 余 情况 





发 送 数据 空 标志 : 


6 1 一 一 THR 和 寄存 硕 和 发 送 移 位 寄存 器 都 为 空 。 辣 发 送 
FIFO 写 入 数据 后 ， 会 自动 清除 该 位 
0 一 一 其 余 情况 


1 一 一 FIFO 模 式 时 ， 至 少 有 一 个 检验 错误 、 帧 错误 或 


7 者 间断 发 生 。 读 LS 寄存 器 后 ， 会 自动 清除 该 位 
0 一 一 其 余 情 况 





(4) 分 频 系数 寄存 器 


两 个 分 频 系 数 寄存 器 形成 一 个 16bit 的 分 频 系 数 ， 其 值 需要 依据 系统 
时 钟 、 波 特 率 进行 计算 ， 计算 方法 如 下 。 


分 频 系 数 = 系统 时 钟 /(16 倍 的 波 特 率 ) 





使 用 上 式 的 结果 设置 分 频 系数 寄存 器 ， 而 且 设 置 的 时 候 ， 要 先 写 高 
字 节 ， 也 就 是 将 分 频 系数 的 高 8 位 写 入 寄存 器 Divisor Latch Byte 2, HS 
低 字 市 ， 也 束 是 将 分 频 系 数 的 低 8 位 写 入 寄存 器 Divisor Latch Byte 1. 





读者 现在 可 能 对 上 述 寄 存 嚣 的 作用 还 不 太 理 解 ， 在 第 14 半 为 小 型 
SOPC 编 写 测试 程序 的 时 候 ， 读 者 会 切实 体会 到 这 几 个 寄存 器 的 作用 。 





13.5 Flash 控制 器 


13.5.1 Flash{iij7> 


本 章 设 计 的 小 型 SOPC 将 程序 保存 在 Flash 中 ， 并 且 从 Flash 启 动 ， 所 
以 需要 Flash 控 制 器 ， 用 来 进行 Flash 的 读 操作 。Flash 主 要 有 两 种 : 
NAND flash, NOR — flash， 前 者 以 * 块 ”为 基本 单位 进行 访问 ， 后 者 

以 “ 字 ” 为 基本 单位 进行 访问 ， 因 此 ， 程 序 可 以 直接 在 NOR Flash 里 运 
行 ， 不 必 把 程序 复制 到 RAM 里 才 运 行 。 也 正 是 这 个 原因 ， 一 般 把 系统 
启动 代码 存放 到 NOR Flash 里 ， 实 现 从 Flash 启 动 系统 。 本 章 实现 的 Flash 
控制 器 实际 就 是 NOR Flash 的 控制 器 ， 下 文中 的 Flash 也 都 是 指 NOR 
Flash， 不 再 明确 指出 。 














NOR Flash 的 接口 一 般 如 表 13-12 所 示 。 
表 13-12 NOR Flash 的 接口 


E 
依据 Flash 容量 确定 一 要 访问 的 地 址 
































2 8、16 或 32 的 数据 / 读 出 的 数据 

3 q 1 ‘i 音 号 ， 低 电 平 有 效 

4 1 输 输出 使 能 信号 ， 低 电 平 有 效 
5 1 A 写 使 能 信号 ， 低 电 平 有 效 


RESET 1 复位 信号 ， 低 电 平 有 效 


Flash 的 读 取 速度 较 低 ， 我 们 设想 的 是 : 小 型 SOPC 将 程序 存储 在 
Flash 中 ， 局 动 后 将 主 应 用 程序 〈 比 如 : 操作 系统 ) 从 Flash 复 制 到 








SDRAM 运 行 ， 以 加 快运 行 速度 ， 所 以 只 涉及 Flash 的 该 操作 ， 本 章 实 现 


的 Flash 控 制 器 也 只 文 持 读 操作 。 








Flash 读 操作 的 时 序 如 图 13-8 所 示 。 在 RESET 无 效 (高 电 平 表示 无 
效 ) 的 前 提 下 ，ADDR 接 口 给 出 读 地 址 ，CE、OE 变 为 有 效 〈 低 电 平 表 
示 有 效 ) ，WE 置 为 无 效 ( 高 电 平 表示 无 效 ) ， 开 始 读 操作 ， 等 待 Tacc 
时 间 后 ， 数 据 通 过 DAT 接 口 输出 。 在 这 个 过 程 中 ， 时 间 Tacc 很 关键 ， 其 
表示 从 给 出 读 地 址 到 数据 输出 的 时 延 ， 不 同型 号 的 Flash 有 不 同 的 Tacc。 






































ADDR xi Hk x 

CE \ | 了 
OE \ | En 
DAT ( A) 
RESET / | 


图 13-8 Flash 读 操作 的 时 序 


13.5.2 Flash 控制 器 的 设计 





从 图 13-8 可 知 ，Flash 的 读 操 作 很 简单 ， 设 置 完成 地 址 信号 、 片 选 信 
号 、 输 出 使 能 信号 后 ， 只 需 等 待 一 段 时 间 Tacc， 束 可 以 得 到 要 读 取 的 数 
据 。 此 处 的 关键 是 Tacc 的 值 是 多 少 ， 该 值 与 具体 Flash 心 片 有 关 。 


本 章 设 计 的 SOPC 将 在 DE2 开 发 平台 上 运行 ，DE2 上 的 Flash 心 片 是 
Spansion 公 司 的 S29AL032D70TFI04， 容 量 是 4MB， 是 一 种 NOR Flash. 
通过 查询 芒 片 手册 可 知 Tacc 最 大 值 等 于 70ns。DE2 上 的 时 钟 有 两 种 : 


27MHz、50MHz， 本 章 设计 的 小 型 SOPC 计 划 采 用 27MHz 的 时 钟 ， 一 个 
时 钟 周期 大 约 是 37ns， 所 以 最 多 需要 等 待 3 个 时 钟 周 期 就 能 得 到 要 读 取 
地 址 的 数据 。 











此 外 ，S29AL032D70TFI04 心 片 的 数据 线 宽度 是 8g， 当 处 理 器 通过 
Wishbone 总 线 读 取 指令 时 ， 一 条 指令 为 32 位 ， 所 以 共 需 要 4 次 Flash 读 操 
作 。 本 书 附 带 光 盘 Doc 目 录 下 有 Flash 芯 片 S29AL032D70TFI04 的 手册 。 

需要 说 明 一 点 : 虽然 本 节 设 计 的 Flash 控 制 器 针对 的 是 
S29AL032D70TFI04 芯 片 ， 但 是 其 他 Flash 忆 片 的 控制 器 都 可 以 在 此 基础 
上 经 过 修改 得 到 。 


13.5.3 ”Flash 控 制 器 的 实现 


Flash 控 制 器 的 接口 如 表 13-13 所 示 ， 可 以 分 为 两 部 分 :Wishbone 总 
线 接口 部 分 〈 序 号 1-10) 、Elash 芯 片 接口 部 分 〈 序 号 11-16) 。 


表 13-13 ”Flash 控制 器 的 接口 


s|s|s|s|s|s|s|s|_ 
> IS IS [5 > >>> 


A a eh iu 


| Wishbone 总 线 时 钟 信号 
Wishbone 总 线 复 位 信号 
Wishbone 总 线 周 期 信号 
Wishbone 总 线 输 入 的 地 址 
Wishbone 总 线 输入 的 数据 
Wishbone 总 线 写 使 能 信号 


Er Cr 
> [mom | 
= je je || 
= 
Cm 
EEE 


7 | wb seli | 4 Wishbone 总 线 字 节选 择 信号 
| wb sbi | Wishbone 总 线 选 通信 号 


D [emo [a [on [wamo samm 
(10 feo [ı Son [waoe sams | 
人 [aas en r | 
ICON Sami [mr CEET 
a [men [ı [sm mao | 


Flash 控 制 器 的 代码 如 下 所 示 ， 源 文件 位 于 本 书 附 带 光 盘 中 
Code\Chapter13\flash 目 录 下 的 wb_flash.v 文 件 中 。 























上 述 代码 就 是 在 有 读 取 Flash 的 请 求 时 (具体 而 言 就 是 读 指令 请 
求 ) ， 分 四 次 从 Flash 中 读 取 出 四 个 字 节 ， 组 成 一 条 指令 。 每 读 取 一 个 字 
节 需 要 3 个 时 钟 周 期 。 另 外 ， 因 为 OpenMIPS 是 大 端 模式 ， 所 以 首先 读 取 
到 的 字 节 对 应 的 是 指令 的 MSB。 


13.6 SDRAM? til 28 





TEAS BEE YE AN) AY SOPC FIBA SDRAM HI ER, HRS 
SDRAM。SDRAM 的 读 / 写 速度 快 于 Flash， 而 且 比 Flash 成 本 低 ， 所 以 一 
般 的 片上 系统 都 具有 较 大 容量 的 SDRAM， 作 为 程序 的 主 运行 空间 。 








小 型 SOPC 中 使 用 的 SDRAM 控 制 器 是 一 个 开源 IP 核 ， 但 是 在 配置 这 
个 IP 核 的 时 候 会 用 到 一 些 SDRAM 的 相关 知识 ， 所 以 本 节 先 对 SDRAM 进 
行 简单 介绍 ， 熟 悉 SDRAM 的 读者 可 以 直接 跳 至 13.6.2 节 。 


13.6.1 SDRAM 人 简介 


13.6.1.1 SDRAM 结 构 


SDRAM (Synchronous Dynamic Random Access Memory) 是 同步 动 
态 随 机 访问 存储 器 ， 同 步 是 指 Memory 工 作 需 要 同步 时 钟 ， 内 部 命令 的 
发 送 与 数据 的 传输 都 以 它 为 基准 ; 动态 是 指 存 储 阵列 需要 不 断 地 刷新 以 
保证 数据 不 丢失 ;随机 访问 是 指数 据 不 是 线性 依次 读 写 ， 而 是 可 以 自由 
中 定 地 址 进行 读 / 写 。 





SDRAM 的 内 部 有 存储 单元 阵列 ， 给 出 行 地 址 、 列 地 址 ， 就 可 以 选 
择 对 应 的 存储 单元 。 如 图 13-9 所 示 。 








Ay 
{> 
Hl- 











列 地 址 
图 13-9 ” SDRAM 内 部 具有 存储 单元 阵列 


这 样 的 存储 单元 阵列 称 为 Bank， 在 一 个 SDRAM 中 往往 有 多 个 
Bank， 寻 址 的 时 候 需 要 给 出 对 应 Bank 的 编号 。SDRAM 的 容量 就 等 
于 “Bank 数 量 * 存 储 单 元 宽度 * 地 址 数 ”"， 例 如 : 某 型 SDRAM 有 4 个 Bank， 
存储 单元 宽度 是 16bit， 行 地 址 数 是 11， 列 地 址 数 是 8， 那 么 该 SDRAM 的 
容量 就 是 32Mbit。 


在 外 部 接口 上 ， 采 用 了 行 地 址 与 列 地 址 复 用 的 方式 ， 为 此 增加 了 两 
个 接口 : 行 地 址 选 通 RAS、 列 地 址 选 通 CAS。 当 RAS 使 能 时 ， 地 址 线 上 
的 信号 是 行 地 址 ， 当 CAS 使 能 时 ， 地 址 线 上 的 信号 是 列 地 址 。SDRAM 
的 接口 一 般 如 表 13-14 所 示 。 


#13-14 SDRAM) 42 0 


宽度 (bit) 
与 具体 SDRAM 有 关 











言 号 ， 低 电 平 有 效 

号 ， 低 电 平 有 效 

诈 地 址 选 通信 号 ， 低 电 平 有 效 

写 操作 信号 ， 低 电 平 有 效 

字 节 选择 和 输出 使 能 ， 低 电 平 有 效 
与 具体 SDRAM 有 关 向 数据 总 线 
与 具体 SDRAM 有 关 全 Bank 选择 信号 


























1 

2 

3 
a 
Ise 
so 
a | 

s 

9 








= 
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13.6.1.2 ”SDRAM 的 刷新 


SDRAM 是 通过 栅 极 电容 存储 信息 的 ， 由 于 电容 会 漏电 ， 所 以 需要 
定期 进行 刷新 ， 以 维持 原 有 信息 ， 刷 新 的 方法 就 是 定时 重复 的 对 
SDRAM 进 行 读 出 和 再 写 入 ， 以 使 电容 中 泄露 的 电 蓓 得 到 补充 。 





13.6.1.3 SDRAM 的 命令 


对 SDRAM 的 访问 是 通过 一 系列 命令 实现 的 ， 不 同 的 接口 信号 组 合 
代表 不 同 的 命令 ， 例 如 : 当 上 一 个 时 钟 周期 CKE 接 口 为 高 电 平 ， 且 本 周 
期 CS 接口 也 为 高 电 平 ， 那 么 表示 是 “器 件 不 使 能 ”命令 。SDRAM 主 要 命 
令 的 真 值 表 如 表 13-15 所 示 。 





表 13-15 SDRAM 主 要 命令 的 真 值 表 


器 件 不 使 能 











预 取 所 有 的 Bank 
设置 模式 寄存 器 
自动 刷新 

开始 自 刷新 SLFRSH 
akama | SIFRSHEX |t ju |a [x [x [x [x jx] 


注 : “H” 代 表 高 电 平 ; “L” 代 表 低 电 平 ; “V” 代 表 有 效 数据 ; “X” 代 表 可 以 是 任何 值 








fo | a 
ae 











13.6.1.4 ”SDRAM 初始 化 





SDRAM 在 加 电 后 ， 必 须 首先 按照 预定 的 方式 进行 初始 化 ， 之 后 才 
能 正常 的 工作 。 初 始 化 需要 四 个 步骤 ， 如 图 13-10 所 示 。 







AN PA / \ / 
y a \ / / + 


8 个 刷新 周期 设置 模式 寄存 器 一 一 > 


200us 的 输入 所 有 Bank 
稳定 期 预 充 电 








2113-10 SDRAM 初始化 的 四 个 步骤 


第 一 步 : 200us 的 输入 稳定 期 ， 在 这 个 时 间 内 只 有 DSEL 和 NOP 命 令 
有 效 ， 这 个 过 程 实际 就 是 自 检 过 程 。 





第 二 步 : 所 有 Bank 预 充电 ， 也 就 是 PALEL 命 令 。 
第 三 步 : 执行 8 个 自动 刷新 周期 ， 也 就 是 CBR 命 令 。 


第 四 步 : 设置 模式 寄存 器 ， 也 吏 是 MRS 命 令 。 模 式 寄 存 器 的 作用 将 
在 下 一 小 节 讲 解 。 


13.6.1.5 模式 寄存 器 


模式 寄存 器 定义 了 SDRAM 的 运行 模式 ， 包 括 CAS 延 人 运 (CAS 
Latency) 、 突 发 类 型 (Burst Type) 、 突 发 长 度 (Burst Length) 、 工 作 
模式 〈Operating Mode) 、 写 入 突 发 模式 等 。 模 式 寄 存 器 的 宽度 是 
13bit， 分 为 多 个 字段 ， 如 图 13-11 所 示 。 读 者 需要 重点 关 注 的 是 其 中 三 
个 字段 : REKE, RRRA CASIER. 





(1) 突 发 长 度 


对 SDRAM 的 读 、 写 操作 都 是 采用 突 发 模式 ， 也 就 是 连续 读 、 写 若 
干 个 数据 (数据 的 宽度 是 SDRAM 数 据 接口 的 宽度 ) 。 模 式 寄 存 器 的 第 
0-2bit 定 义 了 突 发 长 度 ， 设 定 在 一 次 突 发 传输 操作 中 传输 多 少数 据 ， 可 
以 从 1，2，4，8 中 进行 选择 ， 还 有 的 SDRAM 支 持 页 模式 。 









































Bit M12-M10 M9 M8-M7 M6-M4 M3 M2-M0 
标志 名 保留 写 入 突 发 模式 DARA CAS 延 迟 突 发 类 型 突 发 长 度 
M2-M0 ” 突 发 长 度 
000 1 
001 2 
> 010 4 
011 8 
111 页 
, 其 它 保留 
M6-M4 ”CAS 延 迟 时 钟 
M3 RRA 
011 3 —> 0 线性 (Linear) 
其 它 保留 1 


交织 (Interleave) 


图 13-11 ”模式 寄存 器 的 各 个 字段 
(2) 突 发 类 型 


模式 寄存 器 的 第 3bit 定 义 了 突 发 类 型 ， 可 以 有 线性 (Linear) 、 交 织 
(Interleave) 两 种 。 不 同 的 突 发 长 度 、 不 同 的 起 始 地 址 、 不 同 的 突 发 类 
型 ， 会 有 不 同 的 地 址 访问 顺序 ， 如 表 13-16 所 示 。 


13-16 ” 突 发 长 度 、 起 始 地 址 、 突 发 类 型 与 地 址 访问 顺序 的 关系 


突 发 中 的 地 址 访问 顺序 
nö Be 
324% (Interleave) 


最 低位 A0=0 


最 低 两 位 AL, 
最 低 两 位 Al, 





位 Als 


~ A0= 


11 


1-2-3-0 
2-3-0-1 


3-0-1-2 3-2-1-0 








s Al, 


A0=000 


0-1-2-3-4-5-6-7 0-1-2-3-4-5-6-7 





‚ Al, 


A0=001 


1-2-3-4-5-6-7-0 1-0-3-2-5-4-7-6 





y Al, 


A0=010 


2-3-4-5-6-7-0-1 2-3-0-1-6-7-4-5 





y Aly 


























4 

4 

4 

8 

8 

8 

8 

8 
so 
so 


(3) CASKEIE 





A0=011 





3-4-5-6-7-0-1-2 3-2-1-0-7-6-5-4 


模式 寄存 器 的 第 4-6bit 设 定 CAS 延 迟 。CAS 延 迟 指 的 是 从 READ 命 令 
发 出 到 第 一 次 数据 输出 之 间 的 时 间 ， 单 位 是 时 钟 周 期 。 通 常设 定 为 2、3 
个 时 钟 周期 。 也 就 是 说 ， 如 果 READ 命 令 在 第 n 个 时 钟 上 升 沿 被 触发 ， 
那么 数据 将 会 在 第 n+CAS 个 时 钟 上 升 沿 开始 输出 。 图 13-12 是 CAS 为 2 的 
情况 ， 图 13-13 是 CAS 为 3 的 情况 。 





CLK 


/ 











COMMAND READ 人 从 NOP WIK NOP WIK 


DQ 


\ 


\ 





< 一 CAS 延 迟 


图 13-12 CAS 为 2 的 情况 


> 
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CLK / \ / 











COMMAND (READ \(/)X Nop WM NoP WW) Nop DD 一 
DQ | DK Bow MD— 


< CASHEIR > 








图 13-13 ”CAS 为 3 的 情况 


13.6.1.6 ”Bank 行 激活 


SDRAM 中 有 多 个 Bank， 在 进行 任何 读 、 写 操作 之 前 ， 要 先 选 择 进 
行 操 作 的 Bank， 然 后 激活 这 个 Bank 中 相应 的 行 ， 通 过 执行 命令 ACT 来 
完成 这 个 工作 。 执 行 ACT 命 令 时 ， 输 入 接口 BA 选择 Bank， 输 入 接口 A0- 
Ax 选 择 相应 的 行 。 当 ACT 命 令 执 行 完毕 之 后 ， 需 要 进行 操作 的 Bank 中 
的 对 应 行 束 会 被 打开 ， 这 时 束 可 以 进行 读 、 写 操作 了 ， 称 为 激活 。 被 激 
活 的 行 会 保持 激活 状态 ， 直 到 下 一 次 对 所 在 的 Bank 执 行 PRE 命 令 。 


ACT 命令 执行 完毕 之 后 ， 还 不 可 以 立即 进行 读 、 写 操作 ， 需 要 等 待 
一 段 时 间 ， 这 段 时 间 称 为 RAS to CAS Delay， 标 记 为 {RCD， 一 般 情况 
下 ，tRCD 占 用 2-3 个 时 钟 周期 。 如 图 13-14 所 示 。 


CLK 


COMMAND 











tRCD > 


< 


图 13-14 ACT 命令 与 读 、 写 命令 之 间 要 间隔 tRCD 时 间 
13.6.1.7 SDRAMÈ 5 


当 行 地 址 选 定 ， 并 且 相 应 的 行 被 激活 后 ， 就 可 以 进行 读 操 作 了 。 读 
操作 使 用 READ 或 READAP 命 令 ， 一 般 是 突 发 恋 ， 连 续 读 出 否 干 个 数 
据 。 第 一 个 数据 在 经 过 指定 的 CAS 延 时 后 会 出 现在 数据 线 上 ， 以 后 每 个 
时 钟 都 会 读 出 一 个 新 的 数据 ， 直 到 达到 设 定 的 突 发 长 度 。 


写 操作 也 是 类 似 的 ， 使 用 WRITE 或 WRITEAP 命 令 ， 一 般 是 突 发 
， 连 续 写 入 若干 个 数据 。 第 一 个 要 写 入 的 数据 与 写 命令 在 同一 时 间 给 
， 以 后 每 个 时 钟 给 出 下 一 个 要 写 入 的 数据 ， 直 到 达到 设 定 的 突 发 长 


a 


需要 注意 的 是 ， 由 于 SDRAM 的 寻 址 具有 独占 性 ， 所 以 在 进行 完 
读 、 写 操作 后 ， 如 果 要 对 同一 Bank 的 男 一 行进 行 寻 址 ， 那 么 要 将 原来 有 
AA) 的 行 天 财 ， 重 新 发 送行 / 列 地 址 。 可 以 使 用 预 充电 命令 PRE 实 
现 关 闭 现 有 工作 行 、 准 备 打开 新 行 的 操作 。 





13.6.1.8 SDRAM 的 时 间 参 数 

在 SDRAM 的 使 用 中 ， 有 许多 时 间 参 数 需要 注意 ， 在 之 前 的 几 小 节 
中 也 提 到 过 一 些 ， 此 处 将 主要 的 时 间 参 数列 举 如 下 。 

(1) CL (CAS Latency) 


CL 表 示 CAS 延 迟 ， 指 的 是 从 READ 命 令 发 出 到 第 一 次 数据 输出 之 间 
的 时 间 ， 通 常设 定 为 2 或 3 个 时 钟 周期 。 





(2) tWR (Write Recovery time) 


WRASSE TA): 在 执行 写 操 作 时 ， 数 据 并 不 是 即时 地 写 入 
存储 电容 ， 因 为 选 通 三 极 管 与 电容 的 充电 必须 要 有 一 段 时 间 ， 所 以 ， 数 
气 的 真正 写 入 要 有 一 定 的 周期 。 为 了 保证 数据 的 可 靠 写 入 ， 需 要 留 出 足 
够 的 时 间 ， 也 就 是 此 处 的 ftWR， 一 般 大 于 等 于 1 个 时 钟 周 期 。 





(3) tRAS (Active to Precharge Command ) 


tRAS 表 示 ACT 命 令 与 预 充 电 命 令 之 间 的 时 间 间 隅 。 预 充电 命令 至 
少 要 在 行 有 效 命令 5 个 时 钟 周期 后 发 出 ， 最 长 间 隅 视 必 片 而 异 ， 人 否则 工 
作 行 的 数据 有 丢失 的 危险 。 


(4) tRCD (RAS to CAS Delay ) 

参考 13.6.1.6 小 节 。 
(5) tRP (Precharge Command Period ) 

预 充电 命令 后 ， 需 要 相隔 tRP 时 则 ， 才 可 以 打开 新 的 行 。 
(6) tRC (Row Cycle time) 


tRC 表 示 SDRAM 行 周期 时 间 ， 它 是 包括 行 预 充电 到 激活 在 内 的 整个 
过 程 所 需要 的 最 小 时 钟 周 期 数 。 一 般 而 言 ，tRC =tRAS +tRP. 





(7) tREF (Refresh Period) 


tREF 是 刷新 周期 ，SDRAM 需 要 定期 进行 刷新 ， 以 维持 原 有 信息 ， 
存储 体 中 电容 的 数据 有 效 保 存 期 的 上 限 是 64ms， 也 就 是 说 每 一 行 刷新 的 
循环 周期 最 多 是 64ms， 刷 新 速度 的 计算 方法 是 : 行 数量 /64ms。 





13.6.2 SDRAM CONTROLLER IPt% 








通过 上 面 的 学 习 ， 读 考 朋 友 可 能 觉得 SDRAM 很 复杂 ， 是 的 ， 是 很 
复杂 ， 不 过 我 们 并 不 需要 直接 操作 SDRAM， 可 以 通过 SDRAM 控 制 器 进 
行 ， 如 图 13-3 所 示 ，SDRAM 控 制 器 位 于 总 线 与 5DRAM 之 间 ， 从 总 线 接 
收 访问 请 求 ， 然 后 转化 为 SDRAM 的 操作 命令 ， 将 操作 结果 传递 回 总 


线 。 而 SDRAM 控 制 器 有 开源 的 IP 核 可 以 使 用 。 本 章 建立 的 小 型 SOPC 中 
使 用 的 束 是 OpenCores 站 点 提供 的 开源 SDRAM 控 制 器 一 一 SDRAM 
CONTROLLER。 用 户 只 需要 根据 自己 实际 的 SDRAM 心 片 ， 配 置 该 IP 核 
的 一 些 参数 即 可 。 








读者 可 以 在 OpenCores 站 点 下 载 该 IP 核 的 源 代码 ， 也 可 以 直接 在 本 
书 附带 光盘 的 Code\Chapterl3\sdram_controller 目 录 下 找到 所 有 源 代码 。 
另外 ， 本 书 附带 光盘 的 Doc 目 录 下 提供 了 该 卫 核 的 说 明 手 册 。SDRAM 
CONTROLLER 具 有 以 下 特点 。 





。 文 持 SDRAM 的 数据 总 线 宽度 可 以 为 8、16、32。 

。 列 地 址 宽度 可 配置 。 

e 支持 4 个 Bank 的 SDRAM。 

e CAS 延 迟 可 配置 。 

e 文 持 数 据 掩 码 ， 从 而 实现 “部 分 写 ” 操 作 (Partial Write 
Operation) 。 

。 上 自动 控制 刷新 。 

e 文 持 所 有 标准 的 SDRAM 功 能 

e 支持 Wishbone BAK AS. 


该 卫 核 的 接口 可 以 分 为 两 类 ， 一 类 是 Wishbone 总 线 侧 的 接口 ， 另 一 
类 是 SDRAM 芯 片 侧 的 接口 ， 分 别 如 表 13-17、 表 13-18 所 示 。 


%13-17 SDRAM CONTROLLER 1P 核 的 Wishbone 总 线 接口 信号 


Wishbone 总 线 时 钟 信号 
Wishbone 总 线 复 位 信和 号 
Wishbone 总 线 周期 信和 
Wishbone 总 线 输入 的 地 址 
Wishbone 总 线 输入 的 数据 
wb we i 输入 Wishbone 总 线 写 使 能 信和 号 
wb sel i Wishbone 总 线 字 节选 择 信和 号 
a Wishbone 总 线 选 通信 号 

ig 


输 入 








Wishbone ¿EPR 





周期 类 型 识别 地 址 标签 ,是 Wishbone B3 版 本 
11 wb cti i 
A 有 的 信号 


ET 
sa 行 地 址 选 通信 号 ， 低 电 平 有 效 
CE. 列 地址 选 通 信号 ， 低 电 平 有 效 
写 操作 信号 ， 低 电 平 有 效 


字 节 选择 和 输出 使 能 ， 低 电 平 有 效 ， 默 认 宽 
度 为 2 








数据 E 线 ， 默认 宽度 是 16 
SDRAM 初始 化 完毕 信号 ， 为 1 表示 初始 化 


完毕 











表 13-18 中 的 信号 与 表 13-14 中 SDRAM 芯 片 的 接口 是 一 一 对 应 的 ， 
在 使 用 的 时 候 ， 只 需要 将 对 应 的 接口 连接 起 来 即 可 。 需 要 说 明 两 点 。 








(1) 数据 总 线 的 宽度 是 可 配置 的 ， 默 认 是 16， 还 可 以 配置 为 8、 
320 


(2) sdr_init_ done 是 一 个 比较 特别 的 信号 ， 用 来 指出 SDRAM 是 人 否 
初始 化 完毕 ， 也 就 是 说 ， 该 SDRAM CONTROLLER IP 核 具有 SDRAM 初 
始 化 功能 ， 用 户 不 需要 按照 13.6.1.4 小 节 中 的 说 明 自己 初始 化 SDRAM， 


只 需要 等 待 sdr_init _done 变 为 1 即 可 ， 此 时 的 SDRAM 就 已 经 初始 化 完毕 


除了 上 面 的 接口 外 ， 要 使 用 该 卫 核 ， 还 需要 配置 一 些 参数 ， 如 表 
13-19 所 示 。 


#13-19 SDRAM CONTROLLER 1P 核 的 一 些 配置 参数 








| eee ETICO (bit ) 


SDRAM 的 数 

据 总 线 宽度 ; 
\ 

SDRAM, 

cfg_sdr_width 01 16 位 

SDRAM 

1x 8 位 

SDRAM 


= E 


pi 地 址 宽度 : 
00———8bit 
cfg_colbits 01——9bit 
10—— 10bit 
11——11bit 


CN EE 
cfg_sdr_tras_d 值 ， 单 位 是 时 
— 期 


NT 间 tRP 的 


cfg_sdr_trp_d 


cfg_sdr_rfmax 
cfg_req_depth 


从 表 13-19 可 知 ， 为 了 使 用 SDRAM CONTROLLER IP 核 ， 需 要 配置 
很 多 参数 ， 这 些 参数 都 是 与 具体 的 SDRAM 世 片 有 关 ， 可 以 查询 对 应 的 
心 片 手册 。 本 章 设 计 的 小 型 SOPC 将 在 DE2 开 发 平台 上 运行 ， 在 DE2 上 有 
一 个 8MB 的 SDRAM， 型 号 是 Zentel 公 司 的 A3V64S40ETP-G6， 数 据 宽度 


值 ， 单 位 是 时 
钟 周期 


时 间 tRCD 的 
值 ， 单 位 是 时 
钟 周期 


时 间 CL 的 值 ， 
单位 是 时 钟 周 
期 


时 间 tRC 的 
值 ， 单 位 是 时 
钟 周 期 


时 间 tWR 的 


值 ， 单 位 是 时 
钟 周期 


目 动 刷新 命令 
之 间 的 时 间 间 
隔 ， 单 位 是 时 
钟 周期 


pa 


rem 


pa 


N 








是 16 位 ， 有 4 个 Bank， 针 对 该 型 SDRAM， 设 置 SDRAM CONTROLLER 
IP 核 的 配置 参数 如 表 13-20 所 示 。 


#13-20 ”针对 A3V64S40ETP-G6 的 配置 参数 


EJE (bit) | 配置 值 


2'b01 








Vz, 


SH 


B 


1'b1 


2'b00 


序号 
1 | cfg_sdr_width 2 

2 
3 
4 
10 
11 
12 

3 


13 13'b0000000110001 


4 | cfg_sdr_mode_reg 


4'b1000 


cfg_sdr_trp_d 4 4'b0010 


参数 名 
ls cfg_sdr tras_d 4 
Fa cfg_sdr_trced_d 4 


4'b0010 


3'b100 


a | cfg_sdr_trcar_d 


4 4'b1010 


cfg_sdr_twr_d 4 4'b0010 


Fa cfg_sdr_rfmax 


有 以 下 几 点 说 明 。 


1 


N 


12'b011010011000 


3'b100 


2 2'b11 


(1) 模式 寄存 器 配置 为 13b0000000110001， 表 示 CAS 延 迟 为 3 个 时 
钟 周 期 ， 突 发 长 度 为 2 〈 一 次 读 出 16bit，2 次 正好 32bit) ， 突 发 模式 是 线 
ME (Linear) 。 


(2) 参数 cfg_sdr_cas 是 CAS 延 迟 的 值 ， 应 该 等 于 模式 寄存 器 中 配 


置 的 值 ， 但 是 笔者 在 实验 的 过 程 中 发 现 该 值 不 能 等 于 模式 寄存 器 中 配置 
的 值 ， 而 是 要 比 后 者 的 值 大 1， 所 以 此 处 设置 为 3b100。 








(3) A3V64S40ETP-G6 心 片 的 每 个 Bank 有 4096 行 ， 此 处 设置 每 次 
刷新 的 最 大 行 数 cfg_sdr_rfmax 为 4， 所 以 在 64ms 内 要 求 有 1024 次 刷新 ， 
每 次 刷新 之 间 的 时 间 间 隔 是 (64/1024)ms。 另 外 ， 小 型 SOPC 计 划 使 用 
DE2 开 发 平台 上 提供 的 27MHz 时 钟 源 作为 工作 时 钟 ，(64/1024〉 ms 即 
大 约 1688 个 时 钟 周期 ， 所 以 设置 cfg_sdr_rfsh 为 12'b011010011000。 


13.7 实现 基于 实践 版 OpenMIPS 
的 小 型 SOPC 


现在 ，OpenMIPS 处 理 器 、Wishbone 总 线 互 联 和 矩阵 、GPIO 模 块 、 
UART 控 制 器 、Flash 控 制 器 、SDRAM 控 制 器 都 已 经 准备 好 了 ， 要 实现 
在 本 章 一 开始 设计 的 小 型 SOPC， 只 需要 将 这 些 模块 连接 起 来 即 可 ， 为 
此 ， 修 改 openmips_min_sopc.v 文 件 如 下 ， 源 文件 位 于 本 书 附带 光盘 中 
Code\Chapter13 目 录 下 。 


























.wb_we_i(s0_we_0), .wb_dat_i(s0_data_o), 








.wb_sel_i(s0_sel_0), .wb_dat_o(s0_data_i), 








.wb_cyc_i(s@_cyc_o), .wb_cti_i(3'b000), 





// 与 小 型 SOPC 外 部 接口 相连 ， 对 外 连接 SDRAM 











.sdram_clk(clk), .sdram_resetn(-rst), 
.sdr_cs_n(sdr_cs_n_o), .sdr_cke(sdr_cke_o), 
.sdr_ras_n(sdr_ras_n_o), .sdr_cas_n(sdr_cas_n_o), 
.sdr_we_n(sdr_we_n_o), .sdr_dqm(sdr_dqm_o), 
.sdr_ba(sdr_ba_o), .sdr_addr(sdr_addr_o), 


.sdr_dq(sdr_dq_io), 





// SDRAM 控 制 器 的 一 些 配置 ， 参 考 表 13-20 
.cfg_sdr_width(2'b01), .cfg_colbits(2'b0®), 
.cfg_req_depth(2'b11), .cfg_sdr_en(1'b1), 
.cfg_sdr_mode_reg(13'b0000000110001), 








.cfg_sdr_tras_d(4'b1000), .cfg_sdr_trp_d(4'b0010), 
.cfg_sdr_trcd_d(4'b0010), .cfg_sdr_cas(3'b100), 





.cfg_sdr_trcar_d(4'b1010), .cfg_sdr_twr_d(4'b0010), 
.cfg_sdr_rfsh(12'b011010011000), 
.cfg_sdr_rfmax(3'b100) 








// SDRAM 初 始 化 完毕 信号 ， 通 过 GPI0 的 输入 接口 传 给 处 理 器 
.sdr_init_done(sdram_init_done), 


); 


If SEE RARE RE RE RE AE CAP RAE TREE RE ss Ral Pad Rad EAS EOE, Had Sada Ra Rad Re 


























flash_addr_o 
flash_ce_o 


flash_rst_o 
flash_data_i 


sdr_clk_o 
sdr_cs no 
sdr_cke_o 
sdr ras no 
sdr cas n_o 
sdr_we_n_o 
sdr_dqm_o 
sdr_ba_o 
sdr_addr_o 
sdr_dq_io 





sdr cas no 


MA 














宽度 (bit) 输入 /输出 


串口 输入 信和 号 


GPIO 输入 信和 号 
GPIO 输出 信和 号 
Flash 输出 使 能 信 


Flash 地 址 信号 


Flash 写 使 能 信号， 


SDRAM 时 钟 信 
SDRAM 片 选 
SDRAM 时 钟 
SDRAM íf} 


4 串口 输出 信号 


偷 出 
输入 


号 ， 低 电 乎 有 效 


低 电 平 有 效 


SDRAM 列 地 址 选 通信 号 ， 低 电 平 有 效 





sdr we no 





SDRAM 写 操作 信 


3， 低 电 平 有 效 





sdr dqm o 


sdr dq io 





2 
2 











13 
16 





SDRAM 字 节 选择 和 输出 使 能 ， 低 电 平 有 效 
SDRAM 的 Bank 选择 信号 


SDRAM Hi4 





SDRAM 数据 总 线 





第 14 草 ”验证 实践 版 0penMIPS 处 理 


AA 


上 一 章 设计 实现 了 基于 实践 版 OpenMIPS 处 理 器 的 小 型 SOPC， 本 章 
将 把 该 小 型 SOPC 下 载 到 实际 的 FPGA 芯 片 ， 并 运行 测试 程序 ， 通 过 检验 
测试 程序 的 执行 效果 ， 验 证 实践 版 OpenMIPS 处 理 器 是 否 实现 正确 。 


首先 简单 介绍 了 要 用 到 的 开发 平台 DE2， 由 于 DE2 上 的 FPGA 蕊 片 
是 Altera 公 司 的 CycloneII 系 列 ， 所 以 需要 使 用 QuartusI 这 个 软件 来 建立 
工程 ，14.3 节 给 出 了 QuartusII 工 程 的 建立 方法 ， 同 时 说 明了 小 型 SOPC 的 
接口 与 FEPGA 芯 片 引 脚 的 对 应 关系 。14.4 节 说 明了 测试 步骤 。14.5 节 进行 
了 GPIO 实 验 ，14.6 节 进行 了 UART 实 验 ，14.7 节 是 一 个 综合 实验 ， 其 模 
拟 了 操作 系统 的 加 载 过 程 。 


有 的 读者 朋友 可 能 会 抱怨 ， 自 己 拥有 的 开发 平台 不 是 DE2， 没 天 
系 ， 步 又 都 是 相似 的 ， 大 家 可 以 参考 本 章 的 内 容 ， 在 自己 的 开发 平台 上 
验证 、 使 用 OpenMIPS 处 理 器 。 


14.1 DF? 平台 简介 





DE2 是 Altera 公 司 针对 大 学 教学 及 研究 机 构 推出 的 FGPA 多 媒体 开发 
平台 ， 提 供 了 丰富 的 外 设 及 多 媒体 特性 ， 其 核心 FPGA 心 厂 是 Altera 
CycloneII 系 列 的 EP2C35F672。 开 发 平台 的 外 观 如 图 14-1 所 示 。 

DE2 的 主要 资源 列举 如 下 。 


(1) Altera Cyclone II 系列 FPGA 芯 片 EP2C35F672， 内 含 35000 个 逻 
辑 单 元 (LE) o 


WY 


(2) 主动 串 行 配置 器 件 EPCS16。 


WY 


(3) 板 上 内 置 用 于 编程 调试 的 USB “ Blaster， 支持 JTAG 模 式 和 AS 


模式 。 


WY 


(4) 512KBAJSRAM, 8MBAY SDRAM, 4MBHINOR Flash. 





WY 


(5) 具有 SD 卡 接口 、PS2 接 口 。 


WY 


(6) 具有 红外 IrDA 收 发 器 。 


(7) 4 个 按键 、18 个 拨 动 开关 、8 个 绿色 LED 灯 、18 个 红色 LED 
灯 ， 以 及 8 个 7 段 数 码 管 。 


WY 





(8) 板 载 50MHz、27MHz 两 个 铝 振 可 选择 作为 系统 时 钟 ， 也 可 使 
用 外 部 时 钟 。 


(9) 24 位 CD 品质 音频 编 解 码 器 ， 带 有 麦 元 风 输入 插座 、 线 性 输入 


插座 和 线性 输出 插座 。 
(10) VGA 数 模 转 换 占 ， 内 含 3 个 10 位 高 速 DAC。 
(11) 支持 NTSC 和 PAL 和 制式 的 视频 解码 器 ADV7181B。 


(12) 10/100M 以 太 网 控制 器 DM9000AE 及 网 络 接口 。 


USB USB USB 


Ka 设备 “ 主 麦 克 风 线性 线性 视频 VGA 。 以 太 网 “RS232 
um e 输入 输入 输出 输出 ”输出 接口 接口 
ig A 端口 Sm A 
ERA = t t t | | t | t t t 
27MHz 品 振 —= AI” rit 


音频 编 解码 器 






> PS2 接 口 


电源 开关 
USB 主 从 控制 器 VORTA 
Jiha 
p 扩展 端口 2 
Altera USB 4 
Blaster) 2H $ < 一 一 扩展 端口 
EPCS16 配 置 器 件 ccc $ 
eK $ Altera Cyclone II 
JTAG/AS 配 置 模式 aS 
~~ EP2C35 FPGA 
选择 开关 
16x2LCD 模 块 D : SD 卡 插 模 
x <= 
7 段 数码 管 NIERA? mm Fr; 8 个 绿色 LED 
18 个 红色 LED 灯 i 而 ra! IrDA 收 发 器 
mean A -一 一 SMA 外 部 时 钟 
AER TH IP al ie aie US 
18 个 拨 动 开关 bb u | > y 


4 个 按键 





8MB 512KB 
SDRAM SRAM Flash 


DE2 开 发 平台 





50MHz 唱 振 


图 14-1 


(13) USB 主 从 控制 器 及 接口 。 


(14) RS-232 收 发 妖 及 DB9 针 接口 。 


(15) 16x2 字 符 的 LCD 模 块 。 


(16) 两 个 40 针 脚 的 扩展 端口 。 


从 上 述 介 绍 可 知 DE2 具 有 丰富 的 资源 ， 但 是 我 们 的 小 型 SOPC 只 是 


使 用 到 了 其 中 一 部 分 。 





更 加 详细 的 说 明 可 以 参考 本 书 附带 交 盘 中 Doc 目 


录 下 的 PDF 文档 DE2?_ UserManul. 


14.2 ” 训 试 需要 的 使 件 连接 


测试 需要 的 硬件 连接 很 简单 ， 如 图 14-2 所 示 。PC 与 DE2 平 台 之 间 只 
要 两 根 线 ， 一 根 连接 PC 上 的 USB 接 口 与 DE2 上 的 USB Blaster 接 口 ， 供 
下 载 调 试 使 用 。 男 一 跟 连 接 PC 上 的 串口 与 DE2 上 的 串口 ， 这 样 小 型 
SOPC 束 可 以 通过 串口 给 PC 发 送 数 据 ，PC 也 可 以 通过 串口 给 小 型 SOPC 
发 送 数据 。 








DE2 


Blaster 








图 14-2 ”测试 需要 的 硬件 连接 


14.3 QuartusIl T 7 Æ. 


针对 Altera 公 司 的 FPGA， 需 要 使 用 QuartusII 建 立 工 程 ， 然 后 编译 得 
到 可 以 下 载 到 FPGA 上 的 配置 文件 。QuartusII 工 程 建 立 步 骤 如 下 。 


打开 QuartusII， 选 择 File->New Project Wizard， 如 图 14-3 所 示 。 


$, Quartus II 


Edit View Project Assignments Processing To 


En New Project Wizard... 
ey 0 Open Pe 





图 14-3 使 用 “新 工程 向 导 ” 





会 出 现 如 图 14-4 所 示 的 对 话 框 ， 在 其 中 设置 工程 保存 路 径 、 工 程 名 
称 。 其 中 ， 工 程 名 称 可 以 设置 为 openmips_min_sopc。 


$ Hew Project Wizard 


Directory, Name, Top-Level Entity [page 1 of 5] 


Whatis the working directory for this project? 





|E:\openmips_min_sopc 
Whatis the name of this project? 








|openmips_min_sopc] 
What is the name of the top-level design entity for this project? This name is case sensitive and must exactly match the entity name in the design file. 





|openmips_min_sopc 


Use Existing Project Settings... 











Ge) eo) Ces) Cora) ee 





图 14-4 设置 工程 保存 路 径 、 工 程 名 称 





单 击 Next 按 钮 ， 会 出 现 添加 文件 对 话 框 ， 如 图 14-5 所 示 。 单 击 File 
Name 后 面 的 省 略 号 按钮 ， 添 加 本 书 附 带 光 盘 中 Code\Chapter13 目 录 下 的 
所 有 文件 。 


€. New Project Wizard 


Add Files [page 2 of 5] 


Select the design files you want to include in the project. Click Add All to add all design files in the project directory to the project. 


Note: you can always add design files to the project later. 





File name: || kE 


File Name Type Library Design Entry/Synthesis Tool HDL Version 


wb_flash.v 
wb_conmax_top.v 
wb_conmax_slave_if.v 
wb_conmax_rf.v 


wb_conmax_pri_enc.v 


33 
98 
23 
E Y 
ER 


wb_conmax_master_if.v 
wb_conmax_defines.v 
wb_conmax_arb.v 
wb2sdrc.v 

uart_wb.v 
uart_transmitter.v 
uart_top.v 

uart_tfifo.v 
uart_sync_flops.v 


Atmel 


Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default Properties 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Default 
Den 








EB 
Specify the path names of any non-default libraries. 








图 14-5 添加 光盘 Code\Chapter13 目 录 下 的 所 有 文件 


单 击 Next 按 钮 ， 会 出 现 器 件 选择 对 话 框 ， 如 图 14-6 所 示 ， 在 其 中 选 
择 目标 平台 FPGA 芯 片 的 型 号 ， 针 对 DE2 平 台 ， 此 处 选择 CycloneII 系 列 


的 EP2C35F672C6 作 为 目标 器 件 ， 


¢ Hew Project Wizard 


Family & Device Settings [page 3 of 5] 
Select the family and device you want to target for compilation. 


Device family Show in ‘Available devices’ list 





Eamily: |cydone u Package: Any 
Devices: |All Pin count: [Any 


Target device Speed grade: |Any 





© Auto device selected by the Fitter Show advanced devices 
© Specific device selected in ‘Available devices’ list HardCopy compatible only 


Available devices: 


Name Core Voltage LEs User I/Os Memory Bits Embedded multiplier 9-bit elements PLL at 
|EP2C35F48418 ¡ES Y 33216 322 483840 
A TC TI CI 
\EP2C35F672C7 1.2V 475 483340 
[EP2C35F672C8 La 475 483840 
|Ep2C35F67218 12V 475 483840 
|EP2C35U484C6 1.2V 322 483340 
|EP2C35U484C7 1.2V 322 483840 


< 


4 
4 T 
4 16 
4 16 
4 16 








Companion device 


HardCopy: 





Limit DSP & RAM to HardCopy device resources 








Ces Cae) Cora) a) 


图 14-6 选择 目标 平台 上 FPGA 芯 片 的 型 号 


然后 一 直 单 击 Next 按 钮 ， 在 最 后 一 步 单 击 Finish 按 钮 ， 这 样 就 建立 
了 QuartusII 工 程 。 单 击 工具 栏 上 的 Start Compilation 按 钮 ， 将 编译 整个 工 
程 ， 如 图 14-7 所 示 。 


Start Compilation 


A 








图 14-7 点 击 Start Compi lation 按 钮 将 编译 整个 工程 





编译 会 持续 5 一 10 分 钟 左 右 的 时 间 ， 编 译 完 成 之 后 ， 可 以 进行 引 脚 
配置 了 ， 单 击 Assignments->Pin Planner 菜 单 选 项 ， 如 图 14-8 所 示 。 





File Edit View Project MES ia Processing Tools Window Help 


‘Dad & Y o Device... 


ae | # Settings... Ctrl+Shift+E 











‚Project Navigator 









TimeQuest Timing Analyzer Wizard... 








y Openmips.v 
¿2 mem_wb.v @ Assignment Editor Ctrl+Shift+A 
aba 7 z > 
a % Pin Planner Ctrl+Shift-HV 
abg A 
m sd Remove Assignments... 
vw If_id.v 

Ren DS i} Back-Annotate Assignments... 


图 14-8 点 击 Pin Planner 进 行 引 脚 配 置 





出 现 引 脚 配置 窗口 ， 如 图 14-9 所 示 。 在 其 中 将 小 型 SOPC 的 各 个 接 
口 与 FPGA 心 片 的 引 脚 对 应 起 来 。 


Y Pin Planner - F:/VerilogHDL/OpenMIPS/Chapter14/openmips_min_sopc/openmips_min_sopc — ... BEE 


Node Name Direction VREF Group I/O Standard 
$) D fash_addr_o[21..0] Output Group 3.3-V LV...default) 
flash_data_i[7..0] Input Group 3.3-V LV...default) 
Input Group 3.3-V LV...default) 
Output Group 3.3-V LV... default) 
Output Group 3.3-V LV... default) 
Output Group 3.3-V LV... default) 
Bidir Group 3.3-V LV...default) 
Output Group 3.3-V LV...default) 








Top View - Wire Sond 


4) fash_addr_o[21] 
® flash_addr_o[20] 
1 fash_addr_o[19] 
© fash_addr_o[18] 
£ fash_addr_o[17] 
£ flash_addr_o[16] 
® flash_addr_o[15] 
® fiash_addr_o[14] 
£ fiash_addr_o[13] 
£ flash_addr_o[12] 
£ flash_addr_o[11] 
@® flash_addr_o[10] 
TÈ fiash_addr_o[9] 
£ fash_addr_o[8] 
® fiash_addr_o[7] 
< 


pi 
= 
a 
ER 
& 


zj 


qn 


Sd Sd Sd SS SS SS SS Y OW 











«Ko Bed 
AlPins 
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从 第 13 章 的 图 13-15 可 知 ， 小 型 SOPC 的 接口 有 五 类 : 系统 接口 ( 复 
位 rst、 时 钟 clk〉 、GPIO 接 口 ( 输 入 gpio_i、 输 出 gpio_o) 、UART 接 口 


(接收 uart in、 人 发送 uart_out) 、Elash 接 口 、SDRAM 接 口 ， 分 别 连 接 
DE2 平 台 的 如 下 资源 。 


ER 


时 钟 接口 dk 连接 到 DE2 上 的 27MHz 时 钟 源 。 

复位 接口 rst 连 接 到 DE2 上 的 拨 动 开关 SW17， 也 束 是 图 14-1 中 ， 
左下 角 的 那个 拨 动 开关 。 

GPIO 输 入 接口 gpio_j 连 接 到 DE2 上 的 16 个 拨 动 开关 SW0- 
SW15。 

GPIO 输 出 接口 gpio_o 连 接 到 DE2 上 的 4 个 7 段 数码 管 。 

UART 接 口 与 DE2 板 上 的 UART 收 、 发 端口 一 一 对 应 。 

Flash 接 口 与 DE2 板 上 的 Flash 蕊 片 的 引 肢 一 一 对 应 。 

SDRAM 接 口 与 DE2 板 上 的 SDRAM 蕊 片 的 引 肢 一 一 对 应 。 





连接 如 图 14-10 所 示 。 
27MHz 时 钟 源 一 一 > clk sdr_clk_o => 
拨 动 开关 SW17 一 一 > rst sdres no Pp» 


m : sdr cke o > 
串口 接收 一 一 > uart_in 


串口 发 送 < 一 | uart_out sdr ras no mY S 
id g sdr_cas no mY > 
拨 动 开关 SW0-SW15 一 一 > gpio_i sdr we no Pp» = 
4 个 7 段 数 码 管 二 一 一 gpio_o sdr dqm o 一 一 >》 K 
sdr ba o > 
<— flash we_o sdr addr o Pp» 
二 e Los e sdr dq io > 
E < | flash_addr_o 
月 < | flash ce o 


«—— flash rst o 
— Y flash data i 











图 14-10 “小 型 SOPC 与 DE2 平 台 资 源 的 连接 关系 





配置 完 引 脚 后 ， 再 次 编译 该 QuartusII 工 程 ， 得 到 可 以 下 载 到 FPGA 


中 的 配置 文件 openmips_min_sopc.sof。 同 时 得 到 编译 报告 ， 显 示 资 源 占 
用 情况 ， 如 图 14-11 所 示 。 在 本 书 附带 光盘 
Code\Chapter14\openmips_min_sopc 目 录 下 提供 了 完整 的 QuartusII 工 程 。 


:Flow Status: 


Quartus II Version 

Revision Name 

Top-level Entity Name 

Family 

Device 

Timing Models 

Total logic elements 
Total combinational functions 
Dedicated logic registers 

Total registers 

Total pins 

Total virtual pins 

Total memory bits 

Embedded Multiplier 9-bit elements 

Total PLLs 


Successful - Tue Apr 15 18:06:48 2014 
10.1 Build 197 01/19/2011 SP 1 5J Full Version 
openmips_min_sopc 
openmips_min_sopc 

Cyclone II 

EP2C35F672C6 

Final 

10,831 / 33,216 (33 %) 

10,269 / 33,216 (31%) 

4,363 / 33,216 (13 %) 

4363 

125 / 475 (26 %) 

0 


256 / 483,340 ( < 1%) 
8/70(11%) 
0/4(0%) 


图 14-11 ”小 型 S0PC 的 资源 占用 情况 


14.4 测试 步骤 说 明 


上 一 节 编 译 得 到 了 可 以 下 载 到 FPGA 中 的 配置 文件 
openmips_min_sopc.sof， 但 先 别 着 急 下 载 ， 因 为 小 型 SOPC 是 从 Flash 启 
动 的 ， 而 此 时 Flash 中 并 没有 测试 程序 。 正 确 的 测试 步骤 如 图 14-12 所 
TR 








1 编写 测试 程序 











v 






编译 测试 程序 ， 得 到 二 进 制 文件 





将 纲 译 得 到 的 二 进 制 文件 写 入 Flash 





将 配置 文件 openmips_min sopc.sof 下 载 到 FPGA 










复位 OpenMIPS 









6 开始 运行 


图 14-12 正确 的 测试 步 又 





其 中 第 3 步 “ 将 编译 得 到 的 二 进 制 文件 写 入 Flash”* 是 通过 以 下 两 小 步 
实现 的 。 


(1) 将 DE2 开 发 平台 附带 光盘 提供 的 配置 文件 DE2_ USB_API.sof 下 
载 到 FPGA。 本 书 附带 光盘 中 的 DE2 文 件 夹 下 也 提供 了 该 文件 。 


(2) 打开 DE2 开 发 平台 附 市 光盘 提供 的 程序 
DE2_Control_Panel.exe， 本 书 附 带 光盘 的 DE2 文 件 夹 下 也 提供 了 该 程 
序 。 使 用 该 程序 首先 Erase Flash， 然 后 再 将 测试 程序 对 应 的 二 进 制 文件 
E A Flash. 


需要 先 Erase ”Flash， 然 后 再 写 Flash， 这 是 由 Flash 的 特性 决定 的 ， 
Flash 可 以 将 一 个 bit 从 1 变 为 0， 但 是 不 可 以 从 0 变 为 1， 所 以 只 有 先 通 过 
Erase 操 作 ， 将 其 全 部 变 为 1 后 ， 再 写 入 。 


图 14-12 中 ， 第 5 步 的 复位 操作 ， 实 际 就 是 将 拨 动 开关 SW17 癌 上 
拨 ， 使 得 相应 输入 为 高 电 平 ， 该 开关 连接 到 SOPC 的 rst 接 口 ， 所 以 使 得 
rst 的 值 为 1。 


图 14-12 中 ， 第 6 步 的 局 动 操 作 ， 实 际 就 是 将 拨 动 开关 SW17 回 下 
拨 ， 使 得 相应 输入 为 低 电 平 ， 该 开关 连接 到 SOPC 的 rst 接 口 ， 所 以 使 得 
rst 的 值 为 0。 


以 上 束 是 正确 的 测试 步 又， 下 一 节 会 结合 GPIO 实 验 详细 说 明 各 个 
步骤 是 如 何 操作 的 。 本 书 其 余 的 实验 就 不 再 详细 说 明 测 斌 步骤， 只 是 给 
出 测试 代码 、 测 试 结果 。 


14.5 测试 一 一 一 GPIO 实 难 


14.5.1 测试 内 容 


本 测试 的 主要 内 容 是 OpenMIPS 处 理 器 控制 GPIO 的 输出 。 


在 14.3 市 介绍 引 脚 配置 的 时 候 提 到 GPIO 输 出 接口 gpio_o 与 4 个 7 段 数 
码 管 相连 。 所 以 gpio_o 的 值 可 以 通过 7 段 数码 管 显示 出 来 。7 段 数码 管 的 
引 脚 与 数码 管 的 对 应 关系 如 图 14-13 所 示 。 如 果 某 一 引 脚 输入 电 平 为 低 
电 平 ， 那 么 对 应 的 数码 管 就 会 点 亮 ， 比 如 : 如 果 引 脚 a 输 入 低 电 平 ， 那 
么 最 上 面 的 数码 管 就 会 点 亮 。 
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图 14-13 7 段 数 码 管 的 引 脚 与 数码 管 的 对 应 关系 





GPIO 输 出 接口 gpio_o 的 宽度 为 32 位 ， 含 4 个 字 节 ， 每 个 字 节 对 应 一 
个 数码 管 ， 而 每 个 数码 管 只 有 7 个 引 脚 ， 所 以 每 个 字 节 都 有 一 位 没有 使 
用 ， 此 处 统一 设置 为 每 个 字 节 的 最 高 位 没有 使 用 ， 如 图 14-14 所 示 。 








31 29. 27 25 23. 21 19 7. 15 13. 11.9 7 5 3.1 








gpio o 30 28 26 24 22 20 18 16 14 12 10 8 6 4 2 0 
gfedcba gfedcba gfedcba gfedcba 
7 段 数码 管 7 段 数码 管 7 段 数 码 管 7 段 数码 管 
































图 14-14 ”gpio_o 接 口 与 4 个 7 段 数码 管 的 连接 示意 图 


14.5.2 ”测试 程序 


测试 程序 如 下 ， 源 文件 是 本 书 附带 光盘 中 Code\Chapterl4\gpio_test 
目录 下 的 inst_rom.S 文 件 。 





HAHAHAHA, 第 三 及 HAHAHAHA ERA, 


lui $1,0x2000 
ori $1,$1, 0x000c 
lui $2, 0x0000 
ori $2,$2,0x0000 
sw $2,0x0($1) # [AHI HLOx2000000C5 A0x00000000 
# 0x2000000c 对 应 GPI0O 模 块 的 寄存 器 RGPIO_I 


HAHAHAHA AA, EL ERES HAHAHAHA AAA AA, 


lui $1,0x2000 
ori $1,$1,0x0004 
lui $2,0x4740 
ori $2,$2,0x4106 
sw $2,0x0($1) # 向 地 址 90x20000004 写 入 9x47404106 
# 0x20000004 对 应 GPI0O 模 块 的 寄存 器 RGPIO_( 


上 述 测 试 程序 可 以 分 为 三 段 理 解 。 


第 一 段 : 辐 地 址 0x20000008 写 入 0xffffffff，GPIO 模 块 连 接 到 


Wishbone 总 线 互 联 和 矩阵 的 从 设备 接口 2?， 所 以 其 地 址 是 从 0x20000000 开 
始 ， 通 过 表 13-3 可 知 ， 偏 移 为 0x8 的 地 址 对 应 的 是 RGPIO_OE 寄 存 器 ， 向 
该 寄存 器 写 入 0xffffffff， 表 示 GPIO 的 32 个 输出 接口 都 使 能 。 


BZ: 向 地 址 0x2000000c 写 入 0x00000000， 通 过 表 13-3 可 知 ， 偏 





移 为 0xc 的 地 址 对 应 的 是 RGPIO_INTE 寄 存 器 ， 向 该 寄存 器 写 入 
0x00000000， 表 示 中 断 禁 止 。 


第 三 段 ， 向 地 址 0x20000004 写 入 0x47404106， 通 过 表 13-3 可 知 ， 偏 
移 为 0x4 的 地 址 对 应 的 是 RGPIO_OUT 寄 存 器 ， 向 该 寄存 器 写 入 
0x47404106， 表 示 GPIO 输 出 的 信号 是 0x47404106。 


如 果 运 行 正 确 ， 那 么 4 个 7 段 数码 的 显示 应 该 如 图 14-15 所 示 ， 黑 色 
表示 数码 管 被 点 亮 ， 显示“LOVE” 单 词 。 读 者 可 以 结合 图 14-13、 图 14- 
14， 理 解体 会 为 何 0x47404106 会 对 应 这 个 显示 结果 。 
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图 14-15 4 个 7 段 数 码 管 的 预期 显示 效果 


14.53 ”编译 测试 程序 





现在 需要 编译 测试 程序 ， 将 上 述 inst_rom.S 文 件 ， 与 第 4 章 建立 的 
Bin2Mem.exze、Makefile、ram.1d 这 三 个 文件 复制 到 Ubuntu 虚拟 机 中 的 同 
一 个 目录 下 ， 打 开 终 端 ， 使 用 cd 命令 进入 该 目录 ， 然 后 输入 make all, 
即 可 得 到 要 写 入 Flash 的 二 进 制 文件 inst_rom.bin。 





需要 注意 一 点 : 在 编译 前 要 修改 ram.1d 文 件 ， 将 其 中 的 起 始 地 址 从 
0x00000000 修 改 为 0x30000000， 如 下 ， 完 整 文件 位 于 本 书 附带 光盘 中 
Code\Chapterl4\gpio_test 目 录 下 。 





MEMORY 


ram 


ORIGIN = 0x30000000 


, LENGTH = 0x00000300 
i 








做 此 修改 主要 是 因为 测试 程序 是 在 Flash 中 运行 的 ， 而 Flash 的 起 始 
地 址 就 是 0x30000000。 


14.5.4 将 测试 程序 写 入 Flash Fr 


在 14.4 节 已 经 说 明 : 将 测试 程序 写 入 Flash 芯 片 可 以 分 为 两 小 步 。 
1. 将 配置 文件 DE2 USB_API.sof 下 载 到 FPGA。 


2. 打开 程序 DE2_Control Panel.exe， 使 用 该 程序 首先 Erase Flash, 
然后 将 编译 测试 程序 的 得 到 的 二 进 制 文件 写 入 Flash。 


有 具体 操作 步骤 如 下 。 
单 击 QuartusII 工 具 栏 上 的 Programmer 按 钮 ， 如 图 14-16 所 示 。 


Programmer + 


Kr gge Sr ee OO 


图 14-16 单 击 工具 栏 上 的 Programmer 按 钮 


出 现 Programmer 对 话 框 ， 如 图 14-17 所 示 。 单 击 “Change File...”3% 
钮 ， 选 择 DE2 附 带 光 盘 提 供 的 DE2_USB_API.sof 文 件 ， 本 书 附带 光盘 的 
DE2 目 录 下 也 提供 了 该 文件 。 选 中 其 中 的 “Program/Configure” 对 应 的 复 
选 框 ， 然 后 单 击 “Start” 按 钮 ， 将 该 配置 文件 下 载 到 FPGA。 


Ù Programmer — E:/Altera/OpenKIPS nin sopc — OpenMIPS_ min _sopc — [OpenNIPS_min_sopc. cdf] >» 
File Edit View Processing Tools Window 


E Hardware Setup...| USB-Blaster [USB-0] Mode: |JTAG Progress: 


O Enable real-time ISP to allow background programming (for MAX II and MAX V devices) 


(C Piset |] File Device $ = 
— E 2 
¿e? Auto Detect 
X Delete 
Ga Add File... 
15 change File... - 
(= Save File 
(@ Add Device... 
# 

Y Down 





Checksum Usercode Program/ Verify Blank- Examine 
onfigure ch 














图 14-17 Programmer X 7642 


下 载 完 成 后 ， 打 开 DE2 附 这 光盘 或 本 书 附 市 光盘 提供 的 
DE2_Control_Panel.exe 程 序 ， 选 择 Open 菜 单 ， 单 击 Open USB Port 0 选 
项 ， 如 图 14-18 所 示 。 


DE) DE2 Control Panel 


WSA Help About 


| LeD aLeD 


SDRAM 





FLASH 
Random Access 


Address: (0 wDATA : [00 (DATA: oo 
| ‘Sequential Write 
Address: (0 Length: lo [ File Length 


" Sequential Read 


Address: (0 Length : (0 [ Entire Flash 








图 14-18 Open USB Port 


然后 选择 “FLASH” 这 个 Tab， 单 击 Chip Erase 按 钮 ， 将 Erase Flash, 
该 过 程 大 约 需 要 40 秒 的 时 间 。 如 图 14-19 所 示 。 


DE DE2 Control Panel 
Open Help About 


PS2 & 7-SEG | 


LED & LCD 
FLASH 


SDRAM 


FLASH 
Random Access 


Address: lo wDATA : [00 (DATA: |o 


Processing 
cu 


Sequential Read 


Address: fo Length : (0 [ Entire Flash 


E 





EH 14-19 Erase Flash 的 过 程 





Erase Flash 结 束 后 ， 可 以 将 测试 程序 写 入 Flash 了 ， 如 图 14-20 所 示 ， 
选中 File Length 前 面 的 复 选 枉 ， 单 击 “Write a File to FLASH” 按 钮 ， 会 出 


现 一 个 文件 选择 框 ， 在 其 中 选择 之 前 编译 得 到 的 inst_rom.bin 文 件 ， 束 会 
将 该 文件 写 入 Flash。 


DE) DE2 Control Panel 


Open Help About 


PS2&7-SEG | LED&LCD | 
FLASH | SDRAM | SRAM 


FLASH 
Random Access 


Address: [y wDATA: [00 DATA: jo ace 

Chip Erase (40 Sec.) | Write | Read (1) 选中 File Length 
Sequential Write 
Address: el Length: fe] File Length EN ARA, 


Write a File to FLASH 在 弹出 的 对 话 框 中 选 
| 择 要 写 入 的 bin 文 件 





Sequential Read 


Address : [o Length: |p F Entire Flash 
Load FLASH Contentto a File 





图 14-20 ”将 测试 程序 写 入 Flash 


最 后 ， 再 次 选择 Open 沫 单 ， 单 击 Close USB Port 选 项 。 如 图 14-21 所 





DE) DE2 Control Panel 


15:8 Help About 
Open USB Port 0 | LED&LCD | TOOLS | 


SDRAM SRAM | VGA 


图 14-21 Close USB Port 





14.5.5 ”下载 小 型 SOPC 到 DE2 


到 这 一 步 ， 已 经 将 测试 程序 写 入 Flash 了 ， 现 在 ， 可 以 向 FPGA 下 载 
我 们 早 在 14.3 节 就 已 编译 得 到 的 配置 文件 openmips_min_sopc.sof 了 。 下 


载 过 程 很 简单 ， 再 次 打开 QuartusI 的 Programmer 工 具 ， 选 择 在 14.3 节 得 
到 的 OpenMIPS_min_sopc.sof， 然 后 单 击 Start 按 钮 ， 束 将 该 配置 文件 下 
载 到 FPGA 了 o 


14.5.6 ”测试 效果 


好 了 ， 小 型 SOPC 已 经 下 载 到 FPGA 了 ， 测 试 程序 也 已 写 入 Flash 
了 ， 只 需要 复位 一 下 SOPC， 然 后 就 可 以 运行 了 。 让 我 们 拨 动 开关 
SW17， 先 向 上 拨 一 下 ， 再 向 下 拨 一 下 。DE2 上 的 7 段 数 码 管 会 呈现 如 图 
14-22 所 示 的 效果 。 这 证 明 我 们 的 实践 版 OpenMIPS 处 理 器 运行 正确 。 








Lia 





图 14-22 ”小 型 SOPC 运 行 后 的 7 段 数 码 管 显示 效果 


14.6 ”测试 二 一 UART 实 验 


14.6.1 测试 内 容 


本 测试 的 主要 内 容 是 OpenMIPS 处 理 器 通过 UART 输 出 数据 给 PC， 
输出 的 数据 从 0x01 依 次 递增 至 0xFF， 然 后 再 从 0x00 重 新 开始 。 


从 本 测试 开始 ， 不 再 给 出 详细 的 测试 步骤 ， 只 是 给 出 测试 程序 的 说 
明 、 测 试 效果 ， 而 详细 的 测试 步 骆 可 以 参考 上 一 节 GPIO 实 验 。 


14.6.2 ”测试 程序 


测试 程序 如 下 ， 源 文件 是 本 书 附 禹 光盘 Code\Chapter14\uart_test 目 
录 下 的 inst_rom.S 文 件 。 


.org 0x0 

.set noat 

.set noreorder 

.set nomacro 

.global _start 
_start: 


HH HAHAHA AR ar HAHAHA HAHA 


lui $1,0x1000 





上 述 代 码 可 以 分 为 四 段 理解 。 





第 一 段 : 初始 化 UART 控 制 器 ， 包 括 设置 分 频 系数 、 数 据 格式 等 ， 


有 三 小 步 。 


e 首先 ， 向 地 址 0x10000003 写 入 0x80，UART 控 制 器 连接 到 
Wishbone 总 线 互 联 和 矩阵 的 从 设备 接口 1， 所 以 其 地 址 是 从 
0x10000000 开 始 ， 参 考 表 13-7 可 知 ， 地 址 0x10000003 对 应 的 是 
UART 控 制 器 的 Line Control Register， 设 置 LCR 的 值 为 0x80， 
也 就 是 设置 LCR 的 最 高 位 为 1。 设 置 完成 后 ， 地 址 
0x10000000、0x10000001 对 应 的 就 是 两 个 分 频 系数 寄存 器 。 
接着 ， 设 置 分 频 系 数 ， 此 处 设计 UART 的 波 特 率 为 9600bps， 系 
统 时 钟 为 27MHz， 参 考 13.4.2 市 给 出 的 分 频 系 数 计算 公式 ， 得 
到 分 频 系 数 =27000000/(16*9600)， 取 整 后 为 0xB0， 所 以 设置 分 
频 系 数 的 高 字 节 为 0x0， 低 字 节 为 0xB0。 

最 后 ， 设 置 LCR 的 值 为 0x03， 参 考 表 13-10 对 LCR 寄 存 器 的 说 
明 可 知 ， 此 处 就 是 设置 UART 收 、 发 数据 格式 为 8 位 数据 位 、 
没有 奇偶 校 验 位 、1 位 停止 位 。 








第 二 段 : 经 过 上 面 的 步骤 ，UART 控 制 器 已 经 初始 化 完毕 ， 可 以 
收 、 发 数据 了 。 本 段 将 寄存 器 $3 的 值 初 始 化 为 0x0。 


第 三 段 : 这 一 段 是 通过 UART 发 送 数据 的 主 循环 ， 将 寄存 器 $3 的 值 
加 1， 然 后 将 寄存 器 $3 的 最 低 字 节 写 入 地 址 0x10000000， 参 考 表 13-7 可 
知 ， 地 址 0x10000000 对 应 的 是 UARIT 控 制 右 的 Transmitting Holding 
Register， 写 入 其 中 的 数据 会 被 UART 控 制 嚣 发送 出去。 


第 四 段 : 检查 UART 控 制 器 是 否 发 送 数据 完毕 ， 如 果 发 送 完 毕 ， 那 
么 回 到 第 三 段 ， 将 寄存 器 $3 加 1， 再 次 通过 UART 发 送 ， 否 则 ， 等 待 数 
据 发 送 完 毕 。 其 中 ， 检 查 是 否 发 送 完毕 的 方法 就 是 读 取 Line Status 寄 存 








器 的 值 ， 参 考 表 13-11 可 知 ，Line _ Status 寄存 器 的 第 5bit 是 发 送 FIFO 空 标 
志 ， 如 果 数 据 发 送 完 毕 ， 那 么 会 设置 该 位 为 1。 


在 通过 UART 发 送 数据 时 注意 ， 虽 然 UART 控 制 器 具有 了 FIFO， 但 
是 最 好 也 不 要 连续 快速 发 送 数据 ， 人 否则 容易 发 生 FIFO 满 的 情况 ， 导 致 数 
据 丢失 。 所 以 ， 在 测试 程序 中 ， 在 发 送 数据 前 都 要 先 判 断 发 送 FIFO 是 人 否 


> mo 
为 空 
Yo 


14.6.3 测试 效果 


将 上 一 小 节 的 测试 程序 编译 后 ， 写 入 Flash， 然 后 下 载 14.3 节 得 到 的 
小 型 SOPC 的 配置 文件 到 FPGA， 详 细 步 骤 可 以 参考 GPIO 实 验 。 











打开 串口 程序 ， 将 参数 设置 为 与 小 型 SOPC 的 一 样 ， 即 设置 波 特 率 
为 9600bps、8 位 数据 位 、 没 有 奇偶 校 验 位 、1 位 停止 位 。 通 过 拨 动 开关 
SW17 复 位 OpenMIPS， 然 后 启动 OpenMIPS， 串 口 程序 会 得 到 如 图 14-23 
所 示 的 结果 ， 其 中 显示 接收 到 的 数据 从 0x01 递 增 至 0xFF， 然 后 又 从 0x00 
开始 ， 可 知 UART 实 验 成 功 。 





4 串口 的 参数 要 与 小 卉 SOPC 设 置 的 一 样 


/ 





Hb CHE v3.1) 





01 02 03 04 OS 08 07 08 09 OA OB OC OD OE OF 10 11 12 13 14 15 16 

17 18 19 1A 1B 1C 1D 1E 1F 20 21 22 23 24 25 26 27 28 29 24 2B 2C 

2D 2E 2F 30 31 32 33 34 35 36 37 38 39 3A 3B 3C 3D 3E 3F 40 41 42 

43 44 45 46 47 48 49 4A 4B 4C 4D 4E 4F 50 51 52 53 54 55 56 57 58 

9 SA SB SC SD SE SF 60 61 62 63 64 65 86 67 68 69 GA GB 6C BD BE 

F 70 71 72 73 74 75 76 77 78 79 TA TB TC TD TE TF 80 81 82 83 84 

86 87 88 89 SA BB 8C 8D SE BF 90 91 92 93 94 95 96 97 98 99 YA 

OB 9C 9D GE GF AD Al AZ A3 A4 AS AB AT AB A9 AA AB AC AD AE AF BO 

Bi B2 B3 B4 BS ES BT BS B9 BA BB BC BD BE BF CO C1 C2 C3 C4 C5 Ce 

C7 C8 C9 CA CB CC CD CE CF DO DI D2 D3 D4 DS DS D7 DB D9 DA DB DC 

接收 区 设置 DD DE DF EO Ei E2 E3 E4 ES ES ET ES E9 EA EB EC ED EE EF FO Fi F2 
F3 F4 FS F6 FT FS F9 FA FB FC FD FE FF 00 01 02 03 04 05 06 07 08 

一 biti 09 OA OB OC OD OE OF 10 11 12 13 14 15 16 17 18 19 1A 1B 1C 1D 1E 
三 自动 换行 显示 1F 20 21 22 23 24 25 26 27 28 29 2A 2B 2C 2D 2E OF 30 31 32 33 34 
MV 十 六 进 制 显示 35 36 37 38 39 3A 3B 3C 3D 3E 3F 40 41 42 43 44 45 46 47 48 49 4A 
r 暂停 接收 显示 B 4C 4D 4E 4F SO 51 52 53 54 55 56 57 58 59 SA SB SC SD SE SF 60 
61 62 63 64 65 66 67 68 69 GA BB 6C 6D GE GF 70 71 72 73 74 75 76 

7 78 79 TA TB TC 7D TE TF 80 81 82 83 84 85 88 87 88 89 SA 8B 8C 

EERE 8D SE BF 90 91 92 93 94 95 96 97 98 99 YA OB 9C 9D GE OF AD AL AZ 
. A4 AS AB AT AB A9 AA AB AC AD AE AF BO Bi B2 B3 B4 BS BG BT B8 

M 启用 文件 数据 源 .. ， Moo BA BB BC BD BE BF CO Cl C2 C3 C4 CS C8 CT CB C9 CA CB CC CD CE 
厂 自动 发 送 附 加 位 F DO Di D2 D3 D4 DS D6 D7 D8 DS DA DB DC DD DE DF EO El E2 E3 E4 
M 发 送 完 自动 清空 BS ES ET ES E9 EA EB EC ED EE EF FO Fi F2 F3 F4 FS F6 FT FS F9 FA 
三 按 十 六 进 制 FB FC FD FE FF 00 01 02 03 04 05 08 O7 08 09 OA OB OC OD OE OF 10 
11 12 13 14 15 16 17 18 19 1A 1B 1C 1D 1E 1F 20 21 22 23 24 25 26 

T 28 29 2A 2B 2C 2D 2E 2F 30 31 32 33 34 35 36 37 38 39 3A 3B 3C 


接收 : 4723 





和 使 用 十 六 进 制 显示 “接收 到 的 数据 


图 14-23 ”UART 实 验 的 结果 


14.7 测试 三 一 一 模拟 操作 系统 的 


加 载 过 程 
14.7.1 测试 内 容 


本 测试 是 一 个 稍微 综合 的 测试 ， 
用 来 模拟 操作 系统 的 加 载 过 程 ， 其 中 
需要 编写 两 个 程序 : BootLoader、 
SimpleOS。 它 们 在 Flash 中 的 存放 位 
置 如 图 14-24 所 示 。 


BootLoader 存 放 在 Flash 从 0x0 处 
开始 的 空间 ，SimpleOS 存 放 在 Flash 
从 0x304 处 开始 的 空间 ， 另 外 ， 在 
Flash 的 0x300 处 存放 的 是 SimpleOS 的 
长 度 信息 。 





OpenMIPS 启 动 后 ， 会 首先 执行 
BootLoader。BootLoader 读 取 存 放 在 
Flash 的 0x300 处 的 长 度 信息 length， 
根据 该 信息 ， 将 Flash 从 0x304 处 开始 








Flash 
SimpleOS 
0x304 
length 0x300 
BootLoader 
0x0 


HB 14-24 ”BootLoader 、Simple0S 两 个 程序 


在 Flash 中 的 存放 位 置 


的 length 个 字 ， 依 次 复制 到 SDRAM 从 0x0 处 开始 的 空间 ， 也 就 是 将 
SimpleOS 读 取 到 SDRAM。 读 取 结 束 后 ， 跳 转 到 SDRAM 的 0x0 地 址 ， 将 
控制 权 交 给 SimpleOS， 这 个 过 程 模拟 了 目前 一 些 操 作 系 统 的 加 载 过 程 。 


其 中 的 SimpleOS 是 一 个 很 简单 的 程序 ， 实 现 了 UART 的 回 显 。 当 PC 
通过 UART 发 送 数据 给 小 型 SOPC 时 ， 会 引发 UART 控 制 器 的 中 断 ， 
SimpleOS 中 的 中 断 处 理 程序 会 读 取 传 递 过 来 的 数据 ， 然 后 回 送 给 PC， 

从 而 实现 UART 的 回 显 。 从 描述 中 可 以 发 现 ， 该 程序 还 可 以 验证 实践 版 
OpenMIPS 处 理 器 的 中 断 功能 是 否 实现 正确 。 


14.7.2 ”测试 程序 BootLoader 


测试 程序 BootLoader 的 代码 如 下 ， 读 者 可 以 在 本 书 光 盘 
Code\Chapter14\bootloader 目 录 下 找到 源 文件 BootLoader.S， 以 及 编译 所 
需 的 Makefile、ram.ld 等 文件 。 


.Set noat 
.Set noreorder 


.Set nomacro 


.Org 0x0 

,text 

.align 4 

.global _start 
_start: 


HHHHHHHHHHHHHHHHHeHeH = SE: UARTHERIA OGL |= HAH 


lui $1,0x1000 
ori $1, $1, 0x0003 
ori $2, $0, 0x80 














jr $31 # 返回 ， 寄 存 器 $31 存 储 的 是 链接 地 址 


nop 


HHH ”第 九段 : 一 些 预 定义 信息 EE 


.data 
_BootBeginInfoStr: 

„ascii "Loading OS into SDRAM, ..An" 
_BootBeginInfoStrLen: 

.byte 26 
_BootEndInfoStr: 

“ascii "Load OS into SDRAM DONE!!!lXn" 
_BootEndInfoStrLen: 


«byte 28 
上 述 程序 可 以 分 为 九段 理解 ， 分 别 如 下 。 


第 一 段 : 初始 化 UART 控 制 器 ， 包 括 设置 分 频 系 数 、 数 据 格式 。 与 
UART 实 验 中 是 一 样 的 ， 读 者 可 以 参考 14.6.2 节 。 


第 二 段 : 初始 化 GPIO 模 块 ， 包 括 使 能 所 有 输出 接口 、 禁 止 输入 中 
断 。 与 GPIO 实 验 中 是 一 样 的 ， 读 者 可 以 参考 14.5.2 节 。 


第 三 段 : SDRAM 在 使 用 之 前 需要 初始 化 ， 此 处 就 是 等 待 SDRAM 初 
始 化 完毕 。 在 小 型 SOPC 实 现 的 时 候 将 SDRAM 控 制 器 的 输出 信号 
sdram_init done 作 为 GPIO 模 块 输入 信和 号 的 第 16bit， 可 以 参考 13.7 节 ， 上 所 
以 此 处 读 取 GPIO 的 输入 ， 然 后 判断 第 16bit 是 否 为 1， 如 果 为 1， 表 示 
SDRAM 初 始 化 完毕 ， 否 则 ，SDRAM 没 有 初始 化 完毕 。 初 始 化 完毕 后 ， 


程序 可 以 往 后 执行 


第 四 段 : 通过 UART 显 示 一 些 司 动 开始 信息 ， 其 中 
ee _BootBeginInfo StrLen， 都 是 在 第 九段 中 定义 的 ， 
者 是 要 显示 的 启动 开始 信息 ， 是 一 个 字符 串 ， 后 者 是 这 个 字符 串 的 长 
度 。UART 友 送 数 据 是 通过 调用 也 il 的 ， 该 函数 在 第 八 段 中 定 
义 。 注 意 在 这 里 使 用 的 指令 li、la， 这 两 条 指令 都 是 汇编 指令 ， 是 汇编 
器 定义 的 指令 ， 分 别 等 价 于 如 下 机 器 指令 





// 1i 指 令 用 来 加 载 立 即 数 到 寄存 器 
li $1,0x1 等 价 于 ori $1,$0,0x1 


// la 指令 用 来 将 指定 的 地 址 加 载 到 寄存 器 ， 如 下 ， 其 中 %hi(addr ) 表 示 addr 的 高 16bi 

// %lo(addr ) 表 示 addr 的 低 1l6bit 

la $2,_BootBeginInfoStr 等 价 于 lui $2, %hi(_BootBeginInfoStr ) 
addiu $2, $2, %lo(_BootB 


A AB: 读 取 Flash 地 址 0x300 处 的 字 ， 也 就 是 SimpleOS 的 长 度 信 


CI 


第 六 段 : 将 Flash 从 地 址 0x304 开 始 的 SimpleOS 复 制 到 SDRAML。 





第 七 段 : 过 UART 显 示 一 些 局 动 结束 信息 心 ， FN 其 中 
win _BootEndIfoSstrLen， 都 是 在 第 九段 前 者 
是 要 显示 的 启动 结束 信息 一 个 字符 串 ， 后 者 是 这 个 字符 串 的 长 度 。 








第 八 段 : 串口 输出 函数 ， 要 输出 的 字符 就 是 寄存 器 $4 的 最 低 字 市 ， 
将 其 写 入 UART 控 制 器 的 Transmitting Holding Register， 然 后 等 待 发 送 完 
毕 ， 最 后 返回 。 注意 ， 因 为 调用 该 函数 的 时 候 使 用 的 是 jal 指 令 ， 会 将 返 





回 地 址 保存 在 寄存 器 $31 中 ， 所 以 可 以 直接 使 用 jr $31 指 令 返 回 。 读 者 如 
忘记 了 jal 指 令 的 用 法 ， 请 复习 一 下 8.2 节 。 


第 九段 一 些 预 定义 信息 。 


14.7.3 测试 程序 SimpleOS 


测试 程序 SimpleOS 的 代码 如 下 ， 读 者 可 以 在 本 书 光 盘 中 
Code\Chapterl4\simpleos 目 录 下 找到 源 文件 SimpleOS.S， 以 及 编译 所 需 
的 Makefile、ram.ld 等 文件 。 














上 述 程序 可 以 分 为 五 段 理 解 ， 分 别 如 下 。 


BR: 跳 转 到 地 址 0x100 处 ， 因 为 SimpleOS 是 在 SDRAM 中 运行 
的 ， 而 SDRAM 挂 接 在 Wishbone 总 线 互联 算 阵 的 从 设备 接口 0， 所 以 
SDRAM 的 起 始 地 址 是 0x0。 又 因为 OpenMIPS 定 义 的 异常 处 理 例 程 入 口 
地 址 为 0x20、0x40 (参考 表 11-2) ， 所 以 尽量 不 要 使 用 低地 址 空间 ， 此 
处 直接 转移 到 0x100 处 开始 执行 。 


第 二 段 : 在 地 址 0x20 处 ， 定 义 了 中 断 处 理 例 程 。 其 中 获取 CP0 中 
Cause 寄 存 器 的 值 ， 依 据 Cause[11] 的 值 判断 是 否 是 UART 中 断 ， 在 第 13 
章 设计 SOPC 的 时 候 ， 将 UART 控 制 器 的 中 断 输出 uart_int 连 接 到 了 
OpenMIPS 处 理 器 的 中 断 输入 接口 ， 如 下 。 


assign int = {3'b000, gpio_int, uart_int, timer_int}; 


上 面 中 断 输入 接口 int 的 值 最 终 会 被 赋 给 Cause 寄 存 器 的 IP[7:2] 字 段 
(参考 10.3 节 协 处 理 器 CP0 的 实现 ) ，IP[3] 就 对 应 uart_int， 参 考 表 10-6 
可 知 ，IP[3] 是 Cause 寄 存 器 的 第 11bit， 所 以 此 处 依据 Cause[11] 的 值 判 断 
是 否 是 UART 中 断 。 如 果 是 UART 中 断 ， 那 么 转移 到 函数 _int2 进 一 步 处 
理 。 


第 三 段 : 是 地 址 0x100 处 的 程序 ， 在 其 中 初始 化 UART 控 制 器 ， 包 
括 设置 分 频 系数 、 数 据 格式 ， 读 者 应 该 很 熟悉 了， 唯一 增加 的 一 点 是 设 
置 Interrupt Enable Register (IER) ， 访 寄存 占 的 地 址 是 0x10000001， 参 
考 表 13-9 可 知 ， 设 置 其 值 为 0x01， 就 是 使 能 UART 控 制 右 的 数据 接收 中 


第 四 段 : 初始 化 CP0 中 的 Status 寄 存 器 ， 设 置 其 值 为 0x10000801， 参 


考 表 10-5 可 知 ， 即 设置 标志 位 正 为 1、 标 志 位 IM[3] 为 1， 对 于 小 型 SOPC 
而 言 ， 标 志 位 IM[3] 对 应 的 就 是 UART 中 断 ， 所 以 此 处 就 是 使 能 UART 中 
断 。 第 四 段 的 最 后 会 进入 一 个 无 限 循环 ， 等 待 UART 中 断 的 发 生 。 





第 五 段 : 定义 了 函数 _int2， 该 函数 在 第 二 段 的 中 断 处 理 例 程 中 会 被 
调用 。 首 先 获取 UART 控 制 器 的 Line ”Status 寄 存 器 的 值 ， 判 断 最 低位 是 
否 为 1， 参 考 表 13-11 可 知 ， 该 位 为 1 表示 接收 FIFO 不 为 室 ， 有 数据 ， 该 
位 为 0 表示 接收 FIFO 为 空 ， 没 有 数据 。 如 果 没 有 数据 ， 那 么 直接 转移 到 
_end 处 ， 中 断 处 理 结束 。 如 果 有 数据 ， 那 么 先 读 取 数 据 ， 然 后 将 该 数据 
再 通过 UART 发 送出 去 。 接 下 来 等 待 数据 发 送 完 毕 ， 其 过 程 与 UART 实 
验 是 一 样 的 。 数 据 发 送 完毕 后 ， 再 次 判断 是 否 接收 到 数据 ， 如 果 没 有 数 
据 ， 那 么 直接 转移 到 _ end 处 ， 中 断 处 理 结束 。 如 果 有 数据 ， 那 么 再 次 读 
取 数 据 ， 通 过 UART 发 送出 去 。 如 此 反复 ， 直 到 没有 接收 数据 为 止 。 





因为 SimpleOS 是 在 SDRAM 中 运行 ， 所 以 其 链接 脚本 ram.ld 与 本 章 
其 余 实验 不 同 ， 其 中 设置 起 始 地 址 为 0x00000000， 而 不 再 是 
0x30000000， 主 要 修改 如 下 ， 完 整 文件 可 以 参考 本 书 附带 光盘 中 
Code\Chapterl4\simpleos 目 录 下 的 ram.ld。 





MEMORY 


ram : ORIGIN = 0x00000000, LENGTH = 0x00001000 


14.7.4 将 测试 程序 写 入 Elash 


将 上 两 小 节 介绍 的 程序 分 别 编译 ， 得 到 两 个 二 进 制 文件 : 


BootLoader.bin、SimpleOS.bin， 人 然后 需要 将 这 两 个 文件 按照 图 14-24 所 
示 的 要 求 写 入 Flash， 有 两 种 方法 。 


(1) 分 两 次 分 别 将 BootLoader.bin、SimpleOS.bin 写 入 Flash， 写 入 
完成 后 ， 还 要 将 SimpleOS 的 长 上 度 信息 写 入 Flash 的 0x300 处 。 所 以 ， 一共 


需要 写 三 次 Flash。 


(2) 将 BootLoader.bin、SimpleOS.bin、SimpleOS 的 长 度 信息 按照 
图 14-24 所 示 组 合成 一 个 二 进 制 文件 ， 然 后 写 入 Flash， 这 样 只 需 写 一 
次 。 


此 处 只 介绍 第 〈2) 种 方法 ， 在 本 书 附带 光盘 中 Code\Chapter14 目 录 
下 提供 了 一 个 小 程序 BinMerge.exe， 该 程序 也 是 在 Ubuntu 下 运行 的 ， 其 
作用 就 是 将 BootLoader.bin、SimpleOS.bin、SimpleOSs 的 长 度 信息 按照 图 
14-24 所 示 组 合成 一 个 二 进 制 文件 。 


将 BootLoader.bin、SimpleOS.bin 复 制 到 BinMerge.exe 同 一 个 目录 
下 ， 然 后 输入 如 下 命令 。 其 中 -f 后 面 的 参数 是 简单 操作 系统 的 二 进 制 文 
件 ， 此 处 就 是 SimpleOS.bin，-o 后 面 的 参数 是 最 终 输 出 的 二 进 制 文件 
名 ， 此 处 命名 为 Image.bin， 读 者 可 以 依据 实际 情况 命名 。 








./BinMerge.exe -f SimpleOS.bin -o Image.bin 





还 可 以 将 上 述 命令 放 在 SimpleOS 对 应 的 Makefile 文 件 中 ， 这 样 在 编 
译 SimpleOS 的 时 候 ， 就 直接 得 到 Image.bin。 为 此 ， 修 改 SimpleOS 对 应 
的 Makefile 文 件 如 下 。 完 整 文件 可 以 参考 本 书 附 帝 光盘 中 
Code\Chapterl4\simpleos 目 录 下 的 Makefile。 


ifndef CROSS_COMPILE 








./BinMerge.exe -f $< -0 $@ 


clean: 


rm -f *.o *.om SimpleOS.bin *.data *.mif *.asm 


得 到 Image.bin 后 ， 需 要 将 其 写 入 Flash， 本 节 不 再 给 出 详细 的 写 入 步 
骤 ， 读 者 可 以 参考 GPIO 实 验 。 


14.7.5 测试 效果 


将 Image.bin 写 入 Flash， 然 后 下 载 14.3 节 得 到 的 小 型 SOPC 的 配置 文 
件 到 FPGA， 详 细 步 骤 参 考 GPIO 实 验 。 


打开 串口 程序 ， 将 参数 设置 为 与 小 型 SOPC 的 一 样 ， 即 设置 波 特 率 
为 9600bps、8 位 数据 位 、 没 有 奇偶 校 验 位 、1 位 停止 位 。 通 过 拨 动 开关 
SW17 复 位 OpenMIPS， 然 后 启动 OpenMIPS， 串 口 程序 会 得 到 如 图 14-25 
所 示 的 结果 ， 可 知 ，BootLoader 加 载 操 作 系 统 成 功 。 然 后 ，PC 通 过 串口 
发 送 任意 字符 ， 都 会 被 小 型 SOPC 回 送 ， 如 图 14-26 所 示 ， 可 知 SimpleOS 
LARE TS 











串口 的 参数 要 与 小 型 SOPC 设 置 的 一 样 





BEE RBS (CHA SiR V3- 1) 


串口 号 ICOM E Loading OS into SDRAM... 

波 特 率 [9600 r -LLoad OS into SDRAM DONE!!! 
校 验 位 NONE y 

数据 位 | Stir y 


F = BootLoader 加 载 操作 | 
AO | 。 系统 的 信息 





三 接收 转向 文件 . 
厂 自动 换行 显示 
三 十 六 进 制 显示 
厂 暂停 接收 显示 





发 送 区 设置 注意 : 不 使 用 十 六 进 制 显示 


三 启用 文件 数据 源 . . . 
厂 自动 发 送 附加 位 
三 发 送 完 自动 清空 
三 按 十 六 进 制 发 送 
三 数据 流 御 环 发 送 


发 送 间隔 1000 毫秒 


ior 就 绪 ! 接收 :4856 Ft á 





图 14-25 “BootLoader 加 载 操 作 系 统 成 功 
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Loading OS into SDRAM... 
"LLoad OS into SDRAM DONE!!! 


校 验 位 [NONE y 自己 动手 写 CEU,， Baer 
seele =] | PC 接收 到 的 数据 ， 正 | 
mike le) | 是 发 送 的 数据 


接收 区 设置 

厂 接收 转向 文件 .… 

厂 自动 换行 显示 

厂 十 六 进 制 显示 

厂 暂停 接收 显示 

发 送 区 设置 

厂 启用 文件 数据 源 ... 

三 自动 发 送 附加 位 

厂 发 送 完 自动 清空 A 

厂 按 十 六 进 制 发 送 。 |PC 通 过 串口 发 送 的 


厂 数据 流 循环 发 送 数据 


发 送 间隔 [1000 毫秒 er 很 有 趣 吧 ? 


Le 就 绪 ! ade: 接收 :4881 Brit He) 








图 14-26 Simple0S 工 作 正 常 


148 ” ”本章 小 结 


本 章 将 第 13 章 实现 的 小 型 SOPC 下 载 到 开发 平台 DE2， 并 通过 三 个 
实验 GPIO 实 验 、UART 实 验 、 模 拟 操 作 系 统 加 载 过 程 实 验 ， 证 明了 
实践 版 OpenMIPS 处 理 器 设计 正确 ， 并 且 小 型 SOPC 的 各 个 模块 也 都 运行 
正确 。 














第 15 章 将 为 实践 版 OpenMIPS 处 理 器 移植 误 入 式 操 作 系统 hC/OS- 
I 


515% ”为 0penM1PS 处 理 希 移植 
u C/0S-I1 


截止 到 本 章 ， 我 们 已 经 实现 了 实践 版 OpenMIPS 处 理 器 ， 并 且 以 
OpenMIPS 为 核心 ， 实 现 了 一 个 小 型 SOPC， 包 括 : GPIO、UART 控 制 
器 、Flash 控 制 器 、SDRAM 控 制 器 。 应 该 可 以 说 ， 一 个 属于 用 户 自己 的 
小 型 计算 机 诞生 了 。 在 第 14 章 我 们 还 编写 程序 运行 在 这 个 小 型 计算 机 
上 ， 实 现 了 输入 /和 输出、 串口 发 送 数据 等 功能 ， 但 似乎 还 缺少 什么 ， 是 
的 ， 缺 少 一 个 操作 系统 ， 作 为 一 个 完整 的 小 型 计算 机 ， 怎 么 能 够 没有 属 
于 自己 的 操作 系统 呢 ? 现在 就 为 OpenMIPS 处 理 器 打造 属于 自己 的 操作 
系统 。 











本 章 的 目的 是 移植 开源 实时 操作 系统 hC/OS-I 到 OpenMIPS， 首 先 
讨论 了 为 什么 需要 操作 系统 、 什 么 是 实时 操作 系统 ， 然 后 介绍 了 开源 实 
时 操作 系统 hC/OS-II， 主 要 从 其 特点 、 重 要 概念 、 基 本 功能 、 文 件 体 
系 、 移 植 条 件 等 几 个 方面 讲解 。 接 着 详细 给 出 了 移植 HC/OS-II 到 
OpenMIPS 的 步 又， 最 后 ， 通 过 DE2 开 发 平台 验证 移植 后 的 hC/OS-I 工 作 
正确 ， 从 而 证 明 移 植 成 功 。 


15.1 为 什么 需要 操作 系统 


邹 恒 明 在 《计算 机 的 心智 : 操作 系统 之 哲学 原理 》 一 书 中 有 如 下 观 
Ho 


人 有 心智 吗 ? 我 想 所 有 人 都 会 回答 : A! 人 的 心智 就 是 人 的 灵 
o AEREA ME AL Ro. HER RAMAS AFE KEE, 
感受 和 行动 能 





那么 计算 机 有 心 乔 吗 ? 这 不 是 一 个 次 秘 或 者 搞笑 的 问题 。 





人 们 通 第 认为 能 够 运动 的 生命 部 是 有 灵气 的 ， 既 然 计算 机 能 够 完 


成 一 些 人 脑 才 能 够 完成 的 理性 任务 ， 它 当然 也 有 心智 ! 而 这 个 心 乔 就 
是 操作 系统 。 因 为 操作 系统 赋予 了 计算 机 以 活力 。 


操作 系统 作为 计算 机 赖 以 运转 的 控制 中 心 ， 称 其 为 计算 机 的 心 乔 
可 谓 恰 如 其 分 。 





处 理 器 、 存 储 右 、IO 等 便 件 设备 组 成 计算 机 的 艇 这 ， 操 作 系 统 构 
BOT SAL, BADEN ELIA ZC RR MAA A 
诗意 了 ， 但 是 也 印证 了 操作 系统 的 重要 性 。 


操作 系统 是 介 于 计算 机 和 应 用 软件 之 间 的 一 个 软件 系统 ， 用 于 掌控 


计算 机 上 的 所 有 事情 ， 其 下 是 硬件 平台 ， 其 上 是 应 用 软件 。 如 图 15-1 所 
示 。 








应 用 软件 
虚拟 机 器 界面 
操作 系统 
物理 机 器 界面 
硬件 


图 15-1 操作 系统 上 下 界面 


还 是 借用 邹 恒 明 在 《计算 机 的 心智 ;操作 系统 之 哲学 原理 》 一 书 中 
的 观点 ， 其 认为 操作 系统 扮演 两 个 根本 角色 : 魔幻 家 和 管理 者 。 


1. 魔幻 家 角色 


操作 系统 将 计算 机 以 一 种 更 加 容易 、 更 加 方便 、 更 加 强大 的 方式 呈 
MAHE. HAKH, MEZKA, ORREL, E 
复杂 的 东西 变 得 容易 。 例 如 ， 如 宋 在 和 襟 机 上 直接 编程 是 很 困难 的 ， 因 为 
各 种 数据 转移 均 需 要 用 户 目 己 来 控制 ， 对 不 同 设备 要 用 不 同 的 命令 来 驱 
动 ， 而 这 对 一 般 人 来 说 很 难 胜 任 。 操 作 系 统 将 这 些 工 作 从 用 户 手中 接 过 
来 ， 从 而 让 用 户 感 觉 到 编程 是 一 件 容易 的 事 。 











2. 管理 者 角色 


操作 系统 管理 计算 机 上 的 软 硬 件 资源 ， 有 具体 包括 CPU、 内 存 、 外 
存 、IO 等 。 操 作 系统 使 得 不 同 用 户 之 间或 者 同一 用 户 运行 的 不 同 程序 
之 间 可 以 安全 有 序 的 共 孚 这 些 便 件 资源 。 管 理 的 关键 原则 是 有 效 和 公 
平 ， 有 效 指 的 是 不 能 浪费 资源 ， 公 平 指 的 是 每 个 人 都 有 至 有 资源 的 可 


Ab 
HE o 








正 是 因为 操作 系统 扮演 的 这 两 个 角色 ， 可 以 让 应 用 程序 脱离 硬件 ， 


提高 应 用 程序 的 可 移植 性 和 可 读 性 ， 另 外 ， 当 要 实现 的 应 用 比较 复杂 
时 ， 操 作 系 统 可 以 为 这 个 复杂 的 应 用 提供 管理 机 制 ， 程 序 员 只 要 完成 功 
能 函数 ， 并 且 添 加 任务 即 可 ， 不 用 再 去 处 理 不 同 任务 之 间 的 通信 以 及 各 
个 不 同 功 能 之 间 如 何 协同 工作 等 问题 ， 所 以 我 们 需要 操作 系统 。 


15.2 ”和 峙 入 式 实 时 操作 系统 介绍 


既然 操作 系统 如 此 重要 ， 那 我 们 就 给 OpenMIPS 安 装 Windows 好 





当然 不 行 。 首 先 ， 操 作 系统 要 能 够 在 新 的 处 理 器 上 运行 ， 是 需要 修 
改 部 分 代码 的 ， 而 Windows 没 有 公开 源 代码 ， 无 法 修改 。 其 次 ， 
Windows 太 庞大 了 ， 而 我 们 DE2 上 的 Flash 只 有 4MB、SDRAM 只 有 
8MB， 所 以 不 能 运行 Windows。 实 际 上 ， 一 般 在 SOPC 上 运行 的 都 是 一 
WE NTS EN HRA SEN EIER FE (Embedded Real-time Operation 
System) 。 从 名 称 上 可 以 发 现 是 舱 入 式 操 作 系 统 、 实 时 操作 系统 的 交 
集 。 所 以 下 面 分 别 介绍 这 两 种 操作 系统 。 


WN 


1. KAREMERE 


TERE PENT A ERA DURE ARR, ATCA RET EKA LA 
Fe. HI REE IRA AA RENA: 以 应 用 为 中 心 ， 以 计算 
机 技术 为 基础 ， 软 硬件 可 裁 蚤 ， 适 应 应 用 系统 对 功能 、 可 靠 性 、 成 本 、 
体积 、 功 耗 等 严格 要 求 的 专用 计算 机 系统 。 


与 个 人 计算 机 这 样 的 通用 计算 机 系统 不 同 ， 藤 入 式 系统 通常 执行 的 
是 带 有 特定 要 求 的 、 预 先 定义 的 任务 。 由 于 藤 入 式 系统 只 针对 一 些 特 定 
任务 ， 所 以 设计 人 员 能 够 对 它 进行 优化 ， 减 小 尺寸 ， 降 低 成 本 。 





RARER (EOS: Embedded Operating System) W&M FER 


入 式 系统 的 操作 系统 。 
2. 实时 操作 系统 


实时 操作 系统 RTOS: Real Time Operating System) 是 指 当 外 界 事 
件 或 数据 产生 时 ， 能 够 接收 并 以 足够 快 的 速度 予以 处 理 ， 其 处 理 的 结果 
又 能 在 规定 的 时 间 之 内 来 控制 生产 过 程 、 做 出 快速 啊 应 ， 并 控制 所 有 实 
时 任务 协调 一 致 运行 的 操作 系统 。 因 而 ， 提 供 及 时 啊 应 和 高 可 靠 性 是 其 
主要 特点 。 实 时 操作 系统 有 硬 实时 和 软 实 时 之 分 ， 硬 实时 要 求 在 规定 的 
时 间 内 必须 完成 操作 ， 这 是 在 操作 系统 设计 时 保证 的 ;， 软 实 时 则 只 要 按 
照 任务 的 优先 级 ， 尺 可 能 快 地 完成 操作 即 可 。 





RTOS 的 内 核 一 般 采 用 可 和 剥夺 型 内 核 (Preemptive Kernel) ， 在 这 种 
内 核 中 ， 当 有 更 高 优先 级 的 任务 驶 绪 时 ， 总 能 得 到 CPU 的 控制 权 。 上 所 
以 ， 在 可 剥夺 型 内 核 中 ， 最 高 优先 级 的 任务 何 时 可 以 执行 、 何 时 可 以 得 
到 CPU 的 控制 权 ， 有 是 可 知 的 。 





目前 ， 常 用 的 舱 入 式 实时 操作 系统 有 phC/OS-II、RTEMS、 
VxWorks、eCos、FreeRTOS、RTLinux、T-Kemel 等 ， 国 内 目前 也 有 很 
多 ， 比 如 Raw OS、RT-Thread 等 。 本 章 计 划 为 OpenMIPS 处 理 器 移植 
HC/OS-II， 所 以 下 面 仅 对 pC/OS-II 进 行 详细 介绍 。 


15.3 pC/OS-II 人 简介 


hC/OS-I 读 作 “micro COS 2”， 意 为 “ 微 控制 器 操作 系统 版 本 2”"， 是 
一 个 完整 的 、 可 移植 、 可 裁剪 、 开 源 的 、 可 剥夺 型 实时 操作 系统 ， 
hC/OS-I 在 世界 范围 内 得 到 广泛 使 用 ， 包 括 诸多 领域 ， 如 手机 、 路 由 
器 、 人 集线器、 不 间断 电源 、 飞 行 器 、 医 疗 设备 及 工业 控制 等 ， 并 且 得 到 
了 美国 航空 管理 局 的 认证 ， 这 充分 证 明了 pC/OS-II 的 高 度 稳定 可 靠 ， 能 
够 用 于 安全 性 条 件 极 为 敬 刻 的 系统 。 











hC/OS-I 采 用 ANSI 的 C 语 言 编写 ， 包 含 一 小 部 分 汇编 语言 代码 ， 使 
之 可 以 在 不 同 架 构 的 微 处 理 器 上 人 使用。 至今， 从 8 位 到 32 位 ，hC/OS-II 
已 经 在 超过 40 种 不 同 架构 的 微 处 理 器 上 运行 。 


hC/OS-I 的 作者 Jean J. Labrosse 出 版 了 介绍 hC/OS-I 的 书 
(MicroC/OS-II The Real Time Kemel》， 该 书 至 今 已 出 了 第 2 版 ， 是 学 
习 HC/OS-II 的 必 备 书籍 ， 其 中 文 版 由 邵 贝 贝 翻 译 ， 书 名 为 《 艇 入 式 实时 
操作 系统 HC/OS-IT (第 2 版 》， 读 者 朋友 可 以 参考 。 


15.4 nC/OS-II 特 点 





hC/OS-I 具 有 以 下 特点 。 
1. 提供 源 代码 


与 Linux 一 样 ，hC/OS-I 的 源 代码 也 是 开放 的 ， 用 户 可 以 在 
http:/micrium.com/ 网 站 下 载 所 有 源 代 码 。 另 外 ，《 舱 入 式 实 时 操作 系统 
uC/OS-II (82h) 》 一 书 的 附带 光盘 中 也 有 hC/OS-I V2.52 版 本 的 所 有 
源 代 码 。 访 源 代 码 清晰 易 懂 ， 且 结构 合理 ，Jean J.Labrosse 也 提供 了 详 
尽 的 注解 。 





2. 可 移植 (PortabIe) 


HC/OS-II 源 代码 的 绝 大 部 分 是 使 用 移植 性 很 强 的 ANSI C 编 写 的 ， 只 
有 与 微 处 理 器 硬件 相关 的 部 分 是 使 用 汇编 语言 编写 的 。 汇 编 语 言 编写 的 
部 分 已 经 压缩 到 最 低 限度 ， 以 使 1C/OS-II 便 于 移植 到 其 他 微 处 理 器 上 。 


3. 可 固化 (ROMable) 


hC/OS-I 是 为 嵌入 式 应 用 而 设计 的 操作 系统 ， 只 要 具备 合适 的 软 硬 
件 工 具 ， 就 可 将 gC/OS-IHI 租 入 到 产品 中 ， 成 为 产品 的 一 部 分 。 


4. 可 裁 前 (Scalable) 


可 根据 应 用 的 需要 来 裁剪 系统 功能 。 可 以 只 使 用 hC/OS-I 中 应 用 程 
序 需 要 的 系统 服务 ， 也 可 以 使 用 hC/OS-I 的 所 有 功能 ， 从 而 灵活 控制 
hC/OS-I 占 用 的 存储 器 空间 。 包 含 全 部 功能 的 核心 部 分 代码 占用 


By | 


8.3KB， 经 过 裁剪 ， 最 少 仅 为 2.7KB。 
5. 可 剥夺 型 (Preemptive) 


hC/OS-I 是 完全 可 剥夺 型 的 实时 内 核 ， 总 是 运行 优先 级 最 高 的 台 绪 
任务 。 


6. 多 任务 


uC/OS-II V2.52 版 本 可 管理 64 个 任务 ， 一 般 情况 下 ， 建 议 保留 8 个 任 
务 给 hC/OS-II， 这 样 ， 留 给 用 户 应 用 程序 的 任务 最 多 可 有 56 个 。 系 统 赋 
予 每 个 任务 的 优先 级 必须 是 不 同 的 ， 这 意味 着 hC/OS-II 不 支持 时 间 片 轮 
转调 度 法 (Round-robin Scheduling) 。 





最 新 的 LC/OS-II V2.91 版 本 可 以 管理 多 达 250 个 任务 。 
7. 可 确定 性 


hC/OS-I 中 的 绝 大 多 数 函 数 调用 和 服务 的 执行 时 间 具 有 确定 性 ， 也 
就 是 说 ， 用 户 总 是 能 知道 JC/OS-II 的 函数 调用 与 服务 执行 了 多 长 时 间 。 


8. 任务 栈 


每 个 任务 都 有 自己 单独 的 栈 ，hC/OS-I 人 允许 每 个 任务 有 不 同 的 栈 空 
间 ， 以 便 满足 应 用 程序 对 RAM 的 需求 ， 使 用 pC/OS-II 的 栈 空间 校 验 函数 
可 确定 每 个 任务 到 底 需 要 多 少 栈 空间 。 





9. 系统 服务 





hC/OS-II 提 供 很 多 系统 服务 ， 例 如 : (EA AP IAN 
箱 、 消 息 队 列 、 块 大 小 固定 的 内 存 申请 与 释放 、 时 间 管 理 函 数 等 。 


10. 中 断 管理 


中 断 可 使 正在 执行 的 任务 暂时 挂 起 ， 如 果 优 先 级 更 高 的 任务 被 中 晰 
唤醒 ， 那 么 高 优先 级 的 任务 会 在 中 断 租 套 全 部 退出 后 立即 执行 ， 中 断 髓 
套 层 数 最 多 可 达 255 层 。 


11. 稳定 性 与 可 靠 性 


hC/OS-I 是 基于 hC/OS 的 ，hC/OS 自 1992 年 发 布 后 ， 已 有 数 百 个 商 

业 应 用 。hC/OS-I 与 hC/OS 的 内 核 是 一 样 的 ， 只 是 提供 了 更 多 的 功能 。 

另外 ，2000 年 7 月 ，hC/OS-I 在 一 个 航 衬 项目 中 得 到 了 美国 联邦 航空 管 

理 局 (FAA: Federal Aviation Administration) 对 用 于 商用 飞机 的 、 符 合 
RTCA DO-178B 标 准 的 认证 ， 该 标准 对 用 于 航空 设备 方面 的 软件 提出 了 
要 求 。 为 了 符合 这 一 标准 ， 必 须 尽 可 能 地 通过 文件 描述 和 测试 ， 展 示 软 
件 在 稳定 性 与 安全 性 这 两 方面 都 符合 要 求 。 这 一 结论 对 于 操作 系统 来 说 
特别 重要 ， 因 为 这 一 结论 表明 ， 该 操作 系统 的 质量 得 到 了 认证 ， 可 以 在 
任何 应 用 中 使 用 。hC/OS-I 的 每 一 种 功能 、 每 一 个 函数 及 每 一 行 代码 都 
经 过 了 考验 与 测试 。 在 2011 年 发 射 到 火星 的 “好 奇 号 ”火星 探测 车 上 就 有 
一 个 分 析 实 验 室 由 pC/OS-II 控 制 。 














15.5 phnC/OS-II 的 几 个 概念 


15.5.1 任务 


任务 ， 也 称 为 线程 ， 是 一 个 简单 的 程序 。hC/OS-I 是 一 个 多 任务 的 
操作 系统 。 典 型 的 是 ， 每 个 任务 都 是 一 个 无 限 循环 ， 都 可 能 处 在 以 下 五 
种 状态 之 一 一 一休 卢 态 、 就 绪 态 、 运 行 态 、 挂 起 态 、 中 断 态 。 


e WRS (Dormant) : 相当 于 任务 驻 留 在 内 存 中 ， 但 并 不 被 内 

核 所 调度 。 

MAA (Ready): 意味 着 任务 已 经 准备 好 ， 可 以 运行 ,但 由 

于 该 任务 的 优先 级 比 正在 运行 的 任务 的 优先 级 低 ， 所 以 暂时 不 

能 运行 。 任 务 一 旦 创建 ， 就 处 于 就 绕 态 ， 准 备 运 行 。 

运行 态 (Running) : 是 指 任务 掌握 了 CPU 的 使 用 权 ， 正 在 运 

行 中 。 处 于 就 绪 态 的 最 高 优先 级 的 任务 能 够 获得 CPU 的 使 用 

权 ， 从 而 处 于 运行 态 。 

HERA (Pending) : 也 可 称 为 等 竺 事件 态 ， 是 指 任务 在 等 待 

某 一 事件 的 发 生 《〈 例 如 : 等 待 某 外 设 的 IO 操作 ， 等 待 某 共 享 

资源 由 不 能 使 用 变 成 能 使 用 ， 等 待定 时 脉冲 的 到 来 ， 等 等 ) 。 

此 时 ， 任 务 将 被 放 在 该 事件 的 等 待 列表 中 。 

。 中 断 态 〈Interrupt) : 正在 运行 的 任务 可 以 被 中 断 ， 除 非 该 任 
务 将 中 断 关 闭 。 任 务 被 中 断后 ，CPU 将 进入 中 断 服 务 例 程 ， 被 
中 断 的 任务 进入 中 断 态 。 








uC/OS-I V2.91 版 本 最 多 可 管理 250 个 任务 ， 这 些 任务 通常 都 是 一 个 


无 限 循环 的 函数 。 系 统 初始 化 时 会 自动 创建 两 个 任务 : 一 个 是 空闲 任 
务 ， 其 优先 级 最 低 ， 只 是 不 停 地 给 一 个 32 位 的 整 型 变量 加 1， 另 一 个 是 
统计 任务 ， 该 任务 每 秒 运行 一 次 ， 负 责 采 集 当 前 CPU 的 利用 率 。 


每 个 任务 对 应 一 个 任务 控制 块 OS_TCB， 任 务 控制 块 就 是 一 个 数据 
结构 ， 当 任务 的 CPU 使 用 权 被 剥夺 时 ， 需 要 使 用 它 来 保存 该 任务 的 状 
态 。 其 定义 如 下 ， 读 者 不 需要 明白 所 有 的 内 容 ， 只 需要 知道 任务 控制 块 
的 第 一 个 字 中 存储 的 是 该 任务 的 堆栈 栈 顶 指针 ， 在 15.11.3 节 修改 
os_cpu_a.S 文 件 时 ， 需 要 有 这 个 知识 。 











15.5.2 ”任务 调度 


调度 (Dispatch) AWER, LEVE RA AE 
务 运 行 了 。 多 数 实时 内 核 是 基于 优先 级 调度 法 的 。 每 个 任务 根据 其 重要 
程度 的 不 同 ， 被 赋予 一 定 的 优先 级 。 基 于 优先 级 调度 法 是 指 ，CPU 总 是 
让 处 于 就 绪 态 的 、 优 先 级 最 高 的 任务 运行 。 








hC/OS-I 是 可 剥夺 型 实时 多 任务 内 核 。 可 和 剥夺 型 实时 内 核 在 任何 时 
候 都 运行 就 绪 了 的 最 高 优先 级 的 任务 。hC/OS-I 的 任务 调度 是 完全 基于 
任务 优先 级 的 抢占 式 调 度 ， 也 就 是 最 高 优先 级 的 任务 一 旦 处 于 就 绪 状 
态 ， 就 立即 抢占 正在 运行 的 低 优先 级 任务 的 CPU 资 源 。 为 了 简化 系统 设 
计 ，HC/OS-I 规 定 所 有 任务 的 优先 级 不 同 ， 因 而 任务 的 优先 级 也 同时 唯 
一 标识 了 该 任务 本 身 。 


15.5.3 ”任务 切换 


任务 切换 (Context Switch) ， 有 时 也 被 称 为 上 下 文 切 换 。 当 多 任务 
内 核 决 定 运 行 另 一 个 任务 时 ， 它 首先 保存 正在 运行 的 任务 的 状态 
(Context) ， 即 CPU 全 部 寄存 器 的 内 容 。 这 些 内 容 保存 在 任务 的 堆栈 
中 ， 然 后 把 下 一 个 将 要 运行 的 任务 的 状态 从 该 任务 的 堆栈 中 重新 装 入 
CPU 的 寄存 器 ， 开 始 下 一 个 任务 的 运行 ， 这 一 过 程 叫 做 任务 切换 。 





15.5.4 PC/OS-II 的 中 断 处 理 


中 断 发 生 后 ， 一 般 会 进入 中 断 服 务 子 程序 ，hC/OS-I 的 中 断 服 务 子 











程序 要 用 汇编 语言 来 编写 ， 其 结构 如 下 。 


保存 CPU 的 全 部 寄存 器 

调用 函数 0SIntEnter 或 者 直接 将 变量 0SIntNesting 加 1 
清除 中 断 源 

重新 开 中 断 

执行 用 户 代码 做 中 断 处 理 

调用 函数 0SIntEXit 

恢复 CPU 的 全 部 寄存 器 

执行 中 断 返 回 指令 





中 断 可 使 正在 执行 的 任务 暂时 挂 起 ， 所 以 ， 进 入 中 断 服 务 子 程序 
后 ， 首 先 应 将 CPU 的 全 部 寄存 器 保存 到 被 中 断 的 任务 的 堆栈 中 。hC/OS- 
II 需要 知道 正在 做 中 断 服 务 ， 所 以 要 调用 函数 OSIntEnter 或 者 直接 将 全 
局 变量 OSIntNesting 加 1。 这 样 ， 只 要 变量 OSIntNesting 不 为 0， 就 表示 处 
于 中 断 处 理 过 程 中 。 然 后 ， 可 以 选择 是 否 人 允许 新 的 中 断 ， 如 果 人 允许 ， 那 
么 必须 清除 中 断 源 ， 重 新 开 中 断 。 





现在 可 以 正式 开始 处 理 中 断 了 。 中 断 处 理 结束 后 ， 需 要 调用 函数 
OSIntExit， 用 于 将 全 局 变量 OSIntNesting 减 1， 当 OSIntNesting 等 于 0 时 ， 
就 表示 所 有 中 汤 ， 包 括 骸 套 的 中 断 都 已 经 处 理 完毕 。 此 时 ，pC/OS-II 必 
须 判断 是 和 否 有 优先 级 更 高 的 任务 被 中 断 服务 子 程序 唤醒 ， 如 果 有 ， 就 返 
回 到 更 高 优先 级 的 任务 ， 反 之 ， 返 回 到 被 中 断 的 任务 。 将 要 运行 的 任务 
的 寄存 器 从 堆栈 恢复 。 最 后 ， 执 行 中 断 返 回 指令 。 


15.5.5 “时钟 节拍 


时 钟 节拍 (Clock Tick) 是 特定 的 周期 性 中 断 ， 这 个 中 断 可 以 认为 
是 系统 心脏 的 脉动 。 时 钟 的 节拍 式 中 断 使 得 内 核 可 以 将 任务 延 时 若干 个 
整数 时 钟 节 拍 ， 以 及 当 任 务 等 待 事件 发 生 时 ， 提 供 等 待 超时 的 依据 。 时 
钟 节拍 源 可 以 是 专门 的 硬件 定时 器 ， 也 可 以 是 来 自 50/60Hz 交 流 电源 的 
信号 。hC/OS-II 的 节拍 率 应 为 每 秒 10-100 次 ， 或 者 说 10-100Hz。 时 钟 节 
拍 率 越 高 ， 系 统 的 额外 负荷 就 越 重 。 时 钟 节拍 的 实际 频率 取决 于 用 户 应 
用 程序 的 精度 要 求 。 














hC/OS-I 的 启动 过 程 中 ， 一 般 先 调用 系统 初始 化 函数 OSInit， 再 调 
用 系统 启动 函数 OSStart。 在 调用 OSStart 之 后 做 的 第 一 件 事 就 是 允许 时 
钟 节拍 中 断 ， 容 易 犯 的 错误 是 ， 将 允许 时 钟 节拍 中 断 放 在 函数 OSInit 之 
后 、 函 数 OSStart 之 前 。 








void main(void) 


OSInit(); /* 初始 化 nC/0S-II */ 


/* 应 用 程序 初始 化 代码 */ 
/* 通过 调用 函数 0STaskCreate 创 建 至 少 一 个 任务 */ 





TEN TA /* 





15.5.6 ”RhC/OS-II 的 初始 化 


hC/OS-II 在 调用 其 他 任何 服务 之 前 ， 首 先 要 对 系统 初始 化 ， 这 是 通 
过 调用 系统 初始 化 函数 OSImit 实 现 的 ， 该 函数 会 初始 化 hC/OS-I 的 所 有 
变量 和 数据 结构 ， 并 建立 空闲 任务 O0S_TaskIdle， 该 任务 总 是 处 于 就 绪 
态 ， 优 先 级 也 总 是 设 成 最 低 ， 即 OS_LOWEST_PRIO。 如 果 人 允许 建立 统 
计 任 务 ， 那 么 函数 OSInit 还 会 建立 统计 任务 OS_TaskStat， 也 进入 就 绪 
态 ， 优 先 级 是 次 低 的 ， 即 OS_LOWEST_PRIO-1。 


15.5.7 pnC/OS-II 的 启动 


hC/OS-I 局 动 前 ， 至 少 需要 创建 一 个 用 户 任务 。hC/OS-I 的 局 动 是 
通过 调用 函数 OSStart 实 现 的 。OSStart 从 任务 就 绪 表 中 找 出 用 户 建立 的 
优先 级 最 高 的 任务 的 任务 控制 块 TCB。 然 后 调用 高 优先 级 就 绪 任 务 启动 
函数 OSStartHighRdy， 该 阔 数 位 于 文件 os_cpu_a.S 中 。 实 质 上 ， 孙 数 
OSStartHighRdy 的 作用 是 将 任务 堆栈 中 保存 的 值 恢 复 到 对 应 的 CPU 寄存 
器 ， 然 后 执行 一 条 中 断 返 回 指令 ， 就 开始 运行 用 户 建立 的 优先 级 最 高 的 
任务 ， 在 15.11.3 节 会 列 出 该 函数 的 代码 。 





15.6 pC/OS-II 的 基本 功能 


hC/OS-I 实 际 上 是 一 个 实时 操作 系统 内 核 ， 只 包含 了 任务 调度 、 任 
务 间 的 通信 与 同步 、 任 务 管 理 、 时 间 管 理 、 内 存 管理 等 基本 功能 ， 没 有 
提供 输入 /输出 管理 、 文 件 系 统 及 网 络 等 额外 功能 。 其 中 任务 调度 在 
15.5.2 节 已 介绍 ， 所 以 下 面 简单 介绍 hC/OS-I 的 其 余 四 项 基本 功能 


15.6.1 任务 间 的 通信 与 同步 


对 于 一 个 多 任务 操作 系统 而 言 ， 任 务 间 的 通信 和 与 同步 是 必 不 可 少 
的 。 任 务 间 的 同步 是 指 ， 异 步 环 境 下 的 一 组 并 发 执行 任务 因 各 自 的 执行 
结果 互 为 对 方 的 执行 条 件 ， 因 而 ， 任 务 之 间 需 互 发 信和 号， 以 使 各 任务 按 
一 定 的 速度 执行 。hC/OS-I 中 ， 任务 或 中 断 服务 子 程序 可 通过 事件 控制 
块 ECB (Event Control Block) oe 言 号 ， 此 处 的 信号 
(Signal) 也 就 是 事件 (Event) ， 可 以 是 信号 量 、 邮 箱 、 消 息 队 列 等 。 











15.6.2 ”任务 管理 


BD 删除 任务 、 改 变 任 务 的 优先 级 、 挂 起 和 恢 
复 任务 等 功能 ， 通 过 一 系列 函数 实现 。 任 务 管 理 的 主要 函数 如 下 。 








1. OSTaskCreate 或 OSTaskCreateExt， 用 于 建立 一 个 任务 。 


2. OSTaskStkChk， 用 于 检验 堆栈 。 堆 栈 是 由 连续 的 内 存 空间 组 成 


的 ， 每 个 任务 都 有 目 己 的 堆栈 。 本 函数 用 来 检验 堆栈 空间 的 大 小 。 


3. OSTaskDel， 用 于 删除 一 个 任务 。 其 功能 是 将 任务 返回 并 使 之 处 
于 休眠 状态 ， 这 样 系统 将 不 再 调度 该 任务 。 


4.OSTaskDelReq， 用 于 请 求 删除 一 个 任务 。 


5. OSTaskChangePrio， 用 于 改变 任务 的 优先 级 。 任 务 建立 时 ， 系 
统 为 任务 分 配 了 一 个 优先 级 ， 之 后 ， 可 通过 调用 本 函数 来 动态 改变 任务 
的 优先 级 。 


6. OSTaskSuspend， 用 于 挂 起 任务 。 
7. OSTaskResume， 用 于 恢复 被 挂 起 的 任务 。 


8.OSTaskQuery， 用 于 获得 上 自身 或 其 他 任务 的 信息 。 


15.6.3 NAEH 


hC/OS-II 利 用 时 钟 节拍 产生 的 周期 性 中 断 ， 实 现 延 时 和 超时 控制 等 
功能 。 时 间 管 理 是 通过 一 系列 与 时 间 有 关 的 函数 实现 的 。 


1. OSTimeDly， 任 务 延 时 函数 ， 该 函数 会 使 HC/OS-I 进 行 一 次 任务 
调度 ， 并 且 执 行 下 一 个 优先 级 最 高 的 就 绪 态 任务 。 任 务 调用 该 函数 后 ， 
一 旦 规定 的 时 间 期 满 或 者 有 其 他 任务 通过 调用 函数 OSTimeDlyResume 
取消 了 延 时 ， 它 就 会 立即 进入 就 绪 态 。 








2. OSTimeDlyHMSM， 按 时 、 分 、 秒 、 坚 秒 延 时 的 函数 。 与 函数 
er ee ee ee 





时 、 分 、 秒 、 上 毫秒 来 定义 延 时 时 间 。 其 余 功 能 是 一 样 的 。 


3. OSTimeDlyResume， 恢 复 延 时 任务 的 函数 。 通 过 调用 本 函数 ， 
可 使 指定 任务 不 必 等 待 延 时 期 满 ， 就 可 以 处 于 就 绪 态 。 


4. OSTimeGet， 时 钟 节拍 发 生 时 ， 会 将 一 个 计数 器 的 值 加 1， 本 函 
数 用 来 获得 当前 计数 器 的 值 。 


5. OSTimeSet， 本 函数 用 来 设置 计数 器 的 值 。 


15.6.4 ”内存 管理 





ANSI ”C 中 ， 一般 使 用 malloc 和 free 两 个 函数 动态 地 分 配 和 释放 内 
存 。 这 样 ， 随 着 内 存 空间 的 不 断 分 配 和 释放 ， 就 会 把 原来 很 大 的 一 块 连 
续 内 存 区 域 逐 渐 地 分 割 成 许多 非常 小 的 但 彼此 之 间 叉 不 相 邻 的 内 存 块 ， 
也 就 是 产生 内 存 碎 片 问题 。 由 于 系统 中 大 量 内 存 碎片 的 存在 ， 使 得 再 有 
程序 要 求 为 之 分 配 内 存 时 ， 可 能 出 现 总 的 内 存 空间 容量 比 所 要 求 的 大 ， 
但 彼此 不 连续 ， 也 就 是 都 以 碎片 的 形式 存在 ， 导 致 内 存 分 配 失败 的 情 
况 。 而 且 ， 由 于 内 存 管 理 算 法 上 的 原因 ，malloc 和 free 函 数 的 执行 时 间 
是 不 确定 的 ， 这 在 租 入 式 实 时 操作 系统 中 是 非常 危险 的 。 








为 了 解决 多 次 动态 分 配 与 释放 内 存 所 引起 的 内 存 雁 片 以 及 分 配 、 释 
放 函 数 执行 时 间 不 确定 的 问题 ，hC/OS-I 把 连续 的 大 块 内 存 按 分 区 来 管 
理 。 每 个 分 区 都 包含 整数 个 大 小 相同 的 内 存 块 ， 但 不 同 分 区 之 间 内 存 块 
的 大 小 可 以 不 同 。 需 要 动态 分 配 内 存 时 ， 可 选择 一 个 适当 的 分 区 ， 按 块 
来 分 配 内 存 ; 释放 内 存 时 ， 将 该 块 放 回 它 以 前 所 属 的 分 区 。 这 样 ， 就 能 
有 效 解决 内 存 雁 片 问题 。 而 且 ， 每 次 调用 函数 malloc 和 free 进 行 分 配 和 











释放 的 都 是 整数 倍 的 固定 内 存 块 长 ， 这 样 执行 时 间 就 是 确定 的 了 。 


hC/OS-I 中 使 用 内 存 控制 块 (Memory Control Blocks) 的 数据 结构 
跟 踩 每 一 个 内 存 分 区 ， 每 个 分 区 都 有 属于 自己 的 内 存 控制 块 。 内 存 管理 
¡EEES 


1. OSMemCreate， 用 于 建立 一 个 内 存 分 区 。 


2. OSMemGet， 用 于 分 配 一 个 内 存 块 。 当 某 一 任务 被 调度 执行 
时 ， 必 须 先 从 已 建立 的 内 存 分 区 中 为 该 任务 申请 一 个 内 存 块 。 


3. OSMemPut， 释 放 一 个 内 存 块 。 当 某 一 任务 不 再 使 用 一 个 内 存 
块 时 ， 必 须 及 时 地 把 它 放 回 到 相应 的 内 存 分 区 中 ， 以 便 下 一 次 的 分 配 操 
VE. 





4. OSMemQuery， 用 于 查询 一 个 特定 内 存 分 区 的 状态 ， 如 : AW 
内 存 分 区 中 内 存 块 的 大 小 、 可 用 内 存 块 数 、 正 在 使 用 的 内 存 块 数 等 信 


=| 
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15.7 RhC/OS-II 的 文件 体系 


HC/OS-II 的 文件 体系 如 图 15-2 所 示 。 读 者 需要 注意 的 是 ， 此 处 是 以 
V2.91 版 本 为 例 给 出 的 文件 体系 ， 而 《 骨 入 式 实时 操作 系统 HC/OS- 
1 (第 2 版 》 一 书 给 出 的 文件 体系 是 以 V2.52 版 本 为 例 ， 两 者 稍微 有 点 
不 同 ， 读 者 朋友 在 阅读 的 时 候 可 以 对 比 区 分 。 


从 图 中 可 以 发 现 ，hC/OS-I 的 代码 可 以 分 为 四 部 分 。 


。 与 处 理 器 无 关 的 代码 : 这 就 是 hC/OS-I 内 核 的 全 部 代码 。 

。 与 具体 处 理 器 相关 的 代码 : 对 每 一 种 处 理 器 ， 此 处 的 代码 都 有 
区 别 ， 移 植 HC/OS-I 主 要 就 是 修改 此 部 分 的 代码 。 图 15-2 中 ， 
该 部 分 的 文件 是 参照 移植 到 M14K 处 理 器 列 出 的 ， 移 植 到 其 他 
处 理 器 时 ， 该 部 分 的 文件 可 能 会 有 差别 ， 比 如 本 章 将 hC/OS-II 
移植 到 OpenMIPS 处 理 器 时 ， 就 没有 其 中 的 CPU_A.S 文 件 。 








应 用 程序 


























《用户 代码 ) 
uC/OS-II £ 
(与 处 理 器 无 关 代码 ) SRA 
OS _DBG RC 
OS_CORE.C 
OS_FLAG.C 
OS_MBOX.C APP_CFG.H 
OS_MEM.C OS_CFG.H 
OS_MUTEX.C INCLUDES.H 
OS Q.C 
OS_SEM.C 
OS_TASK.C 
OS_TIME.C 
OS_TMR.C 
uCOS_ILC 
uCOS_ILH 
uC/OS-II 
(与 具体 处 理 器 相关 代码 ) 
OS_CPU.H 
CPU.H 
CPU_A.S 
OS_CPU_A.S 
OS_CPU_C.C 











图 15-2 HC/0S-11 的 文件 体系 《以 V2.91 为 例 ) 





。 与 应 用 相关 的 代码 : 与 用 户 应 用 程序 相关 的 头 文件 。 
。 用 户 代 码 : 用 户 编写 的 应 用 程序 。 


15.8 RhC/OS-II 的 移植 条 件 


移植 就 是 使 一 个 操作 系统 能 够 在 某 个 微 处 理 器 平台 或 微 控 制 器 上 运 
行 。 为 了 方便 移植 ，hC/OS-I 的 大 部 分 代码 使 用 C 语 言 编 号 ， 但 是 仍 需 
要 用 C 语 言 和 汇编 语言 编写 一 些 与 处 理 器 人 硬件 相关 的 代码 ， 这 是 因为 
hC/OS-I 在 访问 处 理 器 的 寄存 器 时 ， 只 能 通过 汇编 语言 来 实现 ， 这 部 分 
对 应 的 也 就 是 图 15-2 中 的 “与 具体 处 理 器 相关 代码 ”。 由 于 hC/OS-II 在 设 
计 之 初 就 已 经 充分 考虑 了 可 移植 性 ， 所 以 hC/OS-II[ 的 移植 相对 来 说 是 比 
较 容 易 的 。 为 了 移植 HC/OS-II， 目 标 处 理 器 必须 满足 以 下 条 件 。 

















1 处理 需 的 C 编 译 器 能 产生 可 重 入 代码 


可 重 入 代码 指 的 是 可 被 多 个 任务 同时 调用 ， 而 不 会 破坏 数据 的 一 段 
代码 。hC/OS-I 是 多 任务 内 核 ， 函 数 可 能 会 被 多 个 任务 调用 ， 代 码 的 可 
重 入 性 是 保证 完成 多 任务 的 基础 。 














可 重 入 代码 中 不 应 该 有 全 局 变量 或 静态 变量 ， 因 为 这 些 变量 会 保存 
菏 一 个 进程 的 修改 。 可 重 入 代码 中 的 变量 应 该 都 是 局 部 变量 ， 每 次 重新 
调用 时 变量 被 重新 赋值 ， 从 而 保证 ， 每 个 进程 对 它 的 调用 都 产生 同样 的 
结果 。 图 15-3 列 举 了 两 个 函数 作为 例子 ， 它 们 的 区 别 在 于 变量 temp 不 
同 ， 左 边 函 数 中 的 temp 作 为 全 局 变量 存在 ， 右 边 函 数 中 的 temp 作 为 局 部 
变量 存在 ， 因 此 左边 的 函数 是 不 可 重 入 的 ， 而 右边 的 函数 是 可 重 入 的 。 























int temp; void swap(int * x, int * y) 
f 


void swap(int * x, int * y) . 


: int temp; 
pa” bi 
Ex 一 *kır f *x = "i 

y> *y = temp 
*y = temp; 
N } 














915-3 不 可 重 入 代码 与 可 重 入 代码 示例 








为 了 产生 可 重 入 代码 ， 除 了 在 C 程 序 中 使 用 局 部 变量 ， 还 需要 C 编 
译 器 的 支持 ， 本 书 一 直 在 使 用 的 MIPS 编 译 器 能 生成 可 重 入 代码 。 


2. 用 C 语 言 可 打开 和 关闭 中 断 


OpenMIPS 处 理 器 的 CP0 中 有 Status 寄 存 器 ， 其 最 低位 为 中 断 使 能 标 
志 IE， 通 过 设置 该 位 的 值 ， 能 够 打开 、 关 闭 中 断 。 参 考 10.2 市 。 


3， 处 理 器 支持 中 断 并 且 能 产生 定时 中 断 


HC/OS-II 是 通过 人 处理 器 产生 的 时 钟 节拍 中 断 来 实现 多 任务 调度 的 。 
而 OpenMIPS 处 理 器 文 持 中 断 ， 并 且 能 产生 时 钟 中 断 ， 满 足 此 处 的 要 
求 。 


4. 处 理 器 支持 能 够 容纳 一 定量 数据 的 硬件 堆栈 
OpenMIPS 的 寻 址 空间 达到 4GB， 完 全 能 满足 堆栈 需求 。 


5. 处 理 占 有 将 堆栈 指针 和 CPU 其 余 寄 存 右 读 出 和 存储 到 堆栈 (或 
内 存 ) 的 指令 


hC/OS-I 进 行 任务 调度 时 ， 会 把 当前 任务 的 CPU 寄存 器 存放 到 此 任 
务 的 堆栈 中 ， 然 后 再 从 另 一 个 任务 的 堆栈 中 恢复 原来 的 工作 寄存 器 ， 从 
而 继续 运行 另 一 个 任务 ， 所 以 需要 压 栈 、 出 栈 指令 。 而 OpenMIPS 处 理 
器 具有 lw、sw 等 加 载 存 储 指令 ， 能 够 实现 压 栈 、 出 栈 。 








综合 上 述 分 析 可 知 ，hC/OS-II 能 够 被 移植 到 OpenMIPS 处 理 器 上 。 


从 图 15-2 可 知 ， 移 植 涉及 的 文件 既 有 C 人 代码， 也 有 汇编 代码 ， 必 然 
涉及 两 者 的 混合 编程 ， 还 涉及 函数 调用 ， 所 以 ， 为 了 更 好 地 理解 移植 过 
程 ， 读 者 朋友 应 该 首先 阅读 接 下 来 的 两 节 : C 语 言 中 使 用 汇编 代码 、 
MIPS 函 数 调用 规范 。 如 果 对 这 两 小 节 的 内 容 比较 熟悉 ， 那 么 可 以 直接 
阅读 15.11 节 ， 进 入 移植 过 程 。 


15.9 C 语 言 中 使 用 汇编 代码 


内 核 代码 的 绝 大 部 分 使 用 C 语 言 编写 ， 只 有 一 小 部 分 使 用 汇编 语言 
编写 ， 例如: 与 特定 体系 结构 相关 的 代码 、 对 性 能 影响 很 大 的 代码 。 
SDE MIPS 编 译 占 提供 了 内 嵌 汇 编 的 功能 ， 可 在 C {MSP ERA RIL Se 
语句 ， 方 便 了 程序 设计 。 一 个 简单 的 内 嵌 汇 编 示 例如 下 。 








asm volatile ("syscall") 
“asm” 表 示 后 面 的 代码 为 内 骨 汇 编 ;“volatile” 用 来 告诉 编译 占 不 要 


优化 此 处 的 代码 ， 以 使 后 面 的 指令 保留 原样 ， 括 写 里 面 是 汇编 指令 ， 此 
处 就 是 系统 调用 指令 syscall。 








内 蕉 汇编 语法 如 下 。 
asm (汇编 语句 模板 : 输出 部 分 : 输入 部 分 : 破坏 描述 部 分 ) 


共 四 个 部 分 : 汇编 语句 模板 ， 输 出 部 分 ， 输 入 部 分 ， 破 坏 描 述 部 
分 ， 各 部 分 使 用 “:” 分 隔 开 ， 汇 编 语句 模板 必 不 可 少 ， 其 余 三 部 分 可 选 。 
如 果 茶 一 部 分 没有 使 用 ， 但 其 后 面 的 部 分 使 用 了 了， 那么 要 为 其 保留 位 
置 。 对 这 四 个 部 分 分 别 说 明 如 下 。 

1. 汇编 语句 模板 

汇编 语句 模板 由 汇编 语句 序列 组 成 ， 语 句 之 间 使 
用 “;”、“/n” 或 “ve? 分开。 指令 中 的 操作 数 可 以 使 用 占 位 符 引 用 C 语 言 变 


量 ， 占 位 符 最 多 10 个 ， 名 称 如 下 : %0、%1、... %9。 指 令 中 使 用 占 位 
符 表 示 的 操作 数 ， 总 被 认为 long 型 (4 个 字 节 ) ， 但 对 其 施加 的 操作 根 

















据 指 令 可 以 是 半 字 或 者 字 节 ， 当 把 操作 数 当做 半 字 或 者 字 节 使 用 时 ， 默 
Klee 还 是 高 字 

W. FEE- WMF AMA AERE, DRRR, PRE 
高 字 节 ， 例 如 : %h2。 

















2. 输出 部 分 


输出 部 分 摘 述 输出 操作 数 ， 不 同 的 操作 数 掺 述 符 之 间 用 去 号 格 开 ， 
每 个 操作 数 描述 符 由 限定 字符 串 和 C 语 言 变 量 组 成 。 每 个 输出 操作 数 的 
限定 字符 串 必须 包含 “=” 表示 它 是 一 个 输出 操作 数 。 限 定 字 符 捉 与 具体 
的 处 理 嚣 殿 构 有 关 ， 第 用 限定 字符 串 与 MIPS 架 构 可 能 用 到 的 限定 字符 
串 如 表 15-1 所 示 。 





表 15-1 内 歇 汇 编 中 常用 限定 字符 串 的 描述 





限定 字符 串 


m 
将 操作 数 放 入 通用 寄存 器 


将 操作 数 放 入 浮 点 寄存 器 


操作 数 放 在 内 存 或 通用 寄存 器 
操作 数 是 立即 数 
操作 数 是 内 存 变量 


操作 数 是 内 存 变 量 ， 但 是 其 寻 址 方式 是 偏 移 量 
类 型 ， 也 即 是 基 址 寻 址 ， 或 者 是 基 址 加 变 址 寻 














址 





I 操作 数 是 一 个 16 位 有 符号 常数 


操作 数 是 整数 0 
操作 数 是 一 个 16 位 无 符号 常数 


操作 数 是 一 个 32 位 有 符 写 常数 ， 且 该 第 数 的 低 


16 位 都 为 0 


fp eassa 
操作 数 是 浮 点 0 


BFE ANERER 


操作 数 可 以 是 任何 类 型 
E 输出 操作 数 表 达 式 是 只 写 的 
输出 操作 数 表达 式 是 可 读 可 写 的 


fam: | 输出 操作 数 表 达 式 独占 为 其 指定 的 寄存 器 




















3. 输入 部 分 


输入 部 分 描述 输入 操作 数 ， 不 同 的 操作 数 描 述 符 之 间 用 运 号 格 开 ， 
Se eee 
与 输出 部 分 不 同 之 处 在 于 限定 字符 串 不 需要 包含 “= 





4. 破坏 描述 部 分 














通常 编写 程序 只 使 用 一 种 语言 ， 高 级 语言 或 者 汇编 语言 。 局 级 语言 
编译 的 步 又 大 臻 经过: 预 处 理 -> 编译 -> 汇编 -> 链接 ， 我 们 这 里 只 关心 其 








中 的 编译 ， 用 来 将 高 级 语言 转换 成 汇编 代码 。 在 转换 的 过 程 中 ， 所 有 的 
寄存 器 都 由 编译 器 决定 如 何 分 配 使 用 ， 编 译 器 有 能 力 保证 寄存 妖 的 使 用 
不 会 冲突 。 如 果 全 部 使 用 汇编 语言 ， 则 由 程序 员 去 控制 寄存 器 的 使 用 ， 
也 能 避免 寄存 器 冲突 。 但 是 如 有 果 两 种 语言 混合 使 用 ， 和 情况 就 变 复 架 了 ， 
因为 内 和 伦 的 汇编 代码 可 以 直接 使 用 寄存 器 ， 而 编译 器 并 不 去 检查 内 基 的 
汇编 代码 使 用 了 哪些 寄存 器 。 因 此 ， 需 要 一 种 机 制 告知 编译 器 我 们 使 用 
了 哪些 寄存 器 《程序 员 自 己 知道 内 舱 汇 编 代 码 中 使 用 了 哪些 寄存 句 ) ， 
否则 对 这 些 寄存 器 的 使 用 就 有 可 能 导致 错误 , “破坏 描述 部 分 ? 束 起 这 个 
作用 。 破 坏 描 述 部 分 由 逗号 隅 开 的 字符 串 组 成 ， 每 个 字符 串 描 述 一 种 情 
况 ， 一 般 是 寄存 器 名 ， 此 外 还 有 “memory”。 当 然 ， 在 内 骸 汇 编 的 输 
入 、 输 出 部 分 指明 的 寄存 器 或 者 指定 为 “>”"、“g" 型 由 编译 器 去 分 配 的 寄 
存 嚣 束 不 需要 在 破坏 描述 部 分 描述 ， 因 为 编译 器 已经 知道 了 。 








上 面 介 绍 的 概念 比较 枯燥 ， 还 是 通过 例子 来 理解 ， 读 者 只 需要 理解 
这 两 个 例子 ， 因 为 在 移植 hHC/OS-I 的 过 程 中 也 只 使 用 到 了 这 两 种 形式 。 


例 一 : asm ("mfc0 %0,$13" : "=r"(cause_val)) 


指令 是 mfc0， 读 取 协 处 理 器 CP0 中 Cause 寄 存 器 的 值 ， 保 存 到 
cause_val 中 ， 并 且 cause_val 是 通用 寄存 器 。 


例 二 : asm volatile("mtc0 %0,$12" : :"r"(0x10000401)) 


指令 是 mtc0， 设 置 协 处 理 器 CP0 中 Status 寄 存 器 的 值 为 0x10000401。 
JER: 此 处 只 有 输入 部 分 ， 没 有 输出 部 分 ， 但 是 要 为 输出 部 分 保留 位 
置 。 


15.10” MIPS 函数 调用 规范 


在 移植 HC/OS-II 的 过 程 中 ， 甚 至 在 以 后 的 应 用 中 ， 都 可 能 使 用 C 语 
言 和 MIPS 汇 编 语 言 进 行 混合 编程 ， 必 然 涉 及 两 者 之 间 的 相互 调用 ， 
此 理解 函数 调用 规范 对 移植 、 对 程序 设计 都 有 很 大 的 帮助 。 





本 节 的 函数 调用 规范 是 以 MIPS ABI o32 版 本 为 例 进行 讲解 。ABI 是 
一 种 接口 定义 与 规范 ， 编 译 系统 需要 使 用 这 个 规范 编译 和 链接 程序 ， 
此 ABI 可 以 说 是 高 级 语言 编写 的 应 用 程序 转化 为 二 进 制 可 执行 代码 的 标 
WE. ABRE RE J AFPA, W: 数据 类 型 的 大 小 、 布 局 和 对 齐 ; 调用 约 
定 〈 控 制 着 函数 的 参数 如 何 传送 以 及 如 何 接收 返回 值 ) ;寄存 器 使 用 规 
Ys; 系统 调用 的 编码 和 一 个 应 用 如 何 向 操作 系统 进行 系统 调用 等 等 。 
MIPS ABI 有 三 个 版 本 : 032, n32, n64. 
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MIPS ABI 032 定 义 的 寄存 器 使 用 规范 在 第 1 章 已 经 给 出 ， 此 处 为 方 
便 读者 阅读 ， 再 次 给 出 ， 如 表 15-2 所 示 。 在 本 章 的 讲解 中 会 经 常 使 用 该 
表 。 


表 15-2 寄存 器 使 用 规范 





寄存 器 名 字 约定 命名 用 途 


留 作 汇编 器 生成 一 些 合成 指令 


调用 子 程序 时 ， 使 用 这 4 个 寄存 


$4~$7 a0~a3 





ain FHT A SALE BBL 


sss oo in ee PROTEINEN 


e al 
a > 存 器 值 的 子 程序 必须 存储 旧 的 值 

并 在 退出 前 恢复 ， 对 调用 程序 来 

说 值 不 变 

e p 
TI 


15.102 ”参数 传递 


程序 的 运行 过 程 往往 会 涉及 子 函 数 的 调用 ， 而 函数 调用 需要 传递 参 
数 ，MIPS ABI 032 规 nn 使 用 堆栈 、 使 用 寄存 
器 。 分 别 说 明 如 下 。 























1. 使 用 堆栈 传递 参数 





堆栈 就 是 内 存 中 的 一 段 存储 空间 ， 其 中 可 以 存储 局 部 变量 、 保 存 寄 
存 器 值 、 传 递 参 数 。MIPS 架 构 的 硬件 没有 专用 的 堆栈 操作 指令 ， 所 有 
的 堆栈 操作 都 是 使 用 加 载 、 存 储 指 令 实现 的 。 堆 栈 的 生长 方 同 是 从 高 地 
址 到 低地 址 ， 寄 存 器 sp〈 即 $29， 参 考 表 15-2) 指向 当前 栈 底 。 








函数 调用 时 可 以 使 用 堆栈 传递 参数 。 调 用 函数 在 堆栈 上 建立 一 个 数 
据 结构 来 放置 参数 ， 然 后 使 用 sp 指向 它 ， 第 一 个 参数 〈C 源 代码 中 最 左 
边 的 函数 参数 ) 放 在 最 低位 置 ， 每 个 参数 至 少 占 用 一 个 字 〈32 位 ) ME 
间 。o032 规 定 至 少 要 有 16 字 节 的 栈 空 间 用 于 参数 的 传递 。 如 图 15-4 所 
ZN o 








u | 个 高 地 址 
更 多 参数 占用 的 空间 
(在 前 面 16 字 节 存 放 不 下 的 情况 ) 





放置 参数 4 
放置 参数 3 
放置 参数 2 
程序 进入 时 的 sp 放置 参数 1 y 低地 址 























图 15-4 使 用 堆栈 传递 参数 


2. 使 用 寄存 器 传递 参数 





为 了 提高 程序 的 运行 效率 ， 避 免 耗 时 的 内 存 加 载 和 存储 操作 (也 就 
是 对 堆栈 的 操作 ) ，MIPS ABI o32 规 范 中 约定 将 前 16 个 字 节 所 对 应 的 参 
数 通 过 寄存 器 来 传递 ， 但 同时 保留 堆栈 上 的 这 16 个 字 节 空间 为 空 。 即 ， 
使 用 寄存 器 传递 前 4 个 参数 ， 但 仍 保 留 图 15-4 中 的 4 个 参数 槽 ， 只 是 不 使 
用 而 已 。 用 来 传递 参数 的 4 个 通用 寄存 器 是 a0-a3〈 即 $4-$7， 参 考 表 15- 





2 


关于 MIPS ABI o32 规 范 中 的 参数 传递 ， 可 以 总 结 如 下 : 首先 ， 无 论 
函数 参数 有 多 少 ， 调 用 函数 都 需要 在 堆栈 上 开辟 至 少 16 个 字 节 的 空间 用 
于 参数 传递 ;， 其次， 如 果 4 个 通用 寄存 器 足够 用 于 参数 传递 ， 那 么 参数 
就 不 需要 存储 到 推 栈 中 开辟 的 16 个 字 节 的 空间 中 ， 直 接 通过 通用 寄存 器 
a0-a3 传 递 参数 ， 通 用 寄存 器 放 不 下 的 参数 需要 存储 在 堆栈 中 开辟 的 16 
个 字 节 以 上 的 空间 中 。 


15.10.3 PA BO [al (8 


MIPS ABI o32 规 范 中 ， 整 数 类 型 或 者 指针 类 型 的 函数 返回 值 会 放 入 
寄存 器 v0〈 即 $2， 参 考 表 15-2) 中 ， 而 返回 long long 类 型 的 数据 时 ， 也 
会 使 用 寄存 器 v1 (BNS3) 。 


如 果 返 回 一 个 结构 体 或 其 他 很 大 的 值 ， 不 能 在 寄存 器 v0、v1 中 完全 
返回 ， 需 要 做 如 下 人 处理 ;调用 函数 开辟 一 段 内 存 缓冲 区 ， 使 用 一 个 指针 
指 问 这 块 缓冲 区 ， 并 将 这 个 指针 作为 第 一 个 参数 ， 通 过 寄存 器 a0， 传 给 
馈 调 用 函数 。 当 被 调用 函数 执行 完成 时 ， 将 返回 值 复 制 到 这 块 内 存 绥 冲 
区 中 ， 同 时 将 寄存 器 v0 指向 该 内 存 缓冲 区 。 


15.10.4 ”堆栈 布局 


MIPS ABI 032 规 范 中 ， 函 数 的 堆栈 如 图 15-5 所 示 (该 图 只 是 非 叶子 
函数 的 堆栈 ) 。 前 文 已 述 ， 堆 栈 是 从 高 地 址 癌 低 地 址 生长 的 。 


调用 函数 栈 
高 地 址 





更 多 参数 占用 的 空间 
(在 前 面 16 字 节 存 放 不 下 的 情况 ) 





放置 参数 4 
放置 参数 3 
放置 参数 2 
程序 进入 时 的 sp > 放置 参数 1 


局 部 变量 和 临时 值 




















整数 寄存 器 存储 区 域 





浮 点 寄存 器 存储 区 域 


用 于 婴 套 调用 函数 建立 参数 的 空间 





程序 运行 时 的 sp 





地 址 
被 调用 函数 栈 MR 








815-5 dt FR He A HE hl 





图 中 灰色 区 域 是 函数 自身 需要 的 栈 空间 ， 其 上 部 属于 调用 者 。 


国 数 分 为 叶子 函数 、 非 叶子 函数 。 叶 子 函 数 是 不 调用 其 他 函数 的 函 
数 。 它 们 不 需要 设置 调用 函数 参数 传递 结构 ， 可 以 安全 地 将 数据 放 到 寄 
存 器 t0-t7、a0-a3 以 及 v0、v1， 这 些 寄存 器 在 使 用 之 前 不 需要 保存 其 中 的 
值 。 





非 叶 子 函 数 是 会 调用 其 他 函数 的 函数 。 一 般 来 讲 ， 非 叶子 函数 在 运 
行 之 前 ， 需 要 将 寄存 器 ra 以 及 其 他 圾 要 事先 保存 的 寄存 器 保存 到 堆栈 。 





15.10.5 ”示例 





通过 几 个 例子 来 理解 本 节 介 绍 的 函数 调用 规范 。 
1. 参数 传递 示例 


示例 代码 如 下 ， 作 用 是 将 传 入 的 参数 number 作 为 GPIO 模 块 的 输 
HH 


// 将 number 作 为 GPI0 的 输出 ， 其 中 GPIO_BASE 是 GPI0O 模 块 的 基地 址 ， 在 小 型 SOPC 中 ， 
// 即 为 0x20000000，GPI0O_0UT_REG 是 GPI0 输 出 寄存 器 的 地 址 ， 为 0x4。 下 述 代码 就 和 
// 将 number 存 储 到 地 址 90x20000004， 也 就 是 设置 GPI0O 模 块 的 输出 为 number 。 


void gpio_out(INT32U number ) 


{ 
REG32(GPIO_BASE + GPIO_OUT_REG) = number; 


上 述 C 代 码 在 编译 后 ， 会 得 到 如 下 汇编 指令 。 将 寄存 器 a0 的 值 存 储 
到 地 址 0x20000004， 根 据 15.10.2 节 介绍 的 参数 传递 可 知 ， 寄 存 器 a0 中 保 
存 的 正 是 传递 进来 的 参数 number。 


<gpio_out>: 

lui v0,0x2000 

ori v0O,v0, 0x4 

sw a0,0(v0) # 将 寄存 器 ag 的 值 保存 到 9x20000004 

jr ra # 寄存 器 ra 保存 的 是 返回 地 址 ， 此 处 就 是 返回 到 调用 程序 


nop 


函数 返回 值 示 例 


示例 代码 如 下 ， 作 用 是 读 取 GPIO 的 输入 。 


//GPIO_BASE 是 GPI0O 模 块 的 基地 址 ， 在 小 型 SOPC 中 ， 即 为 90x20000000，GPIO_IN_RI 
//GPI0 输 入 寄存 器 的 地 址 ， 为 9x0， 所 以 下 述 代 码 就 是 读 取 地 址 为 0x20000000 处 的 值 ， 
// 该 值 ， 也 就 是 读 取 GPIO 的 输入 

INT32U gpio_in() 


INT32U temp = 0; 
temp = REG32(GPIO_BASE + GPIO_IN_REG); 
return temp; 

N 


上 述 C 代 码 在 编译 后 ， 会 得 到 如 下 汇编 指令 ， 主 要 内 容 是 加 载 
0x20000000 处 的 字 ， 保 存 到 寄存 器 v0 中 ， 然 后 返回 ， 正 是 15.10.3 节 介绍 
的 函数 返回 规范 所 要 求 的 。 


<gpio_in>: 


lui v1, 0x2000 


lw v0,0(v1) # 加 载 0x20000000 处 的 字 ， 保 存 到 寄存 器 v6 中 
jr ra # 寄存 器 ra 保存 的 是 返回 地 址 ， 此 处 就 是 返回 到 调用 程序 
nop 


3. 非 叶 子 函 数 堆栈 布局 示例 


示例 代码 如 下 ， 这 是 用 户 创建 的 一 个 任务 ， 其 中 初始 化 定时 占 ， 每 
隔 100ms 通 过 串口 输出 Info 数 组 中 的 两 个 字 节 ， 同 时 改变 GPIO 的 输出 。 
详细 的 解释 会 在 15.12 节 编写 测试 程序 的 时 候 再 介绍 ， 读者 此 时 只 需要 





明白 一 点 一 一 这 个 函数 是 非 叶 子 函 数 ， 因 为 在 其 中 会 调用 OSInitTick、 
uart_putc、gpio_out、OSTimeDly 等 函数 。 我 们 需要 考察 的 是 其 堆栈 布 
局 。 





上 述 C 代 码 在 编译 后 ， 会 得 到 如 下 汇编 指令 〈 只 截取 前 几 条 指 


es 





sw s5,36(sp) 
sw S4,32(sp) 
sw S3,28(sp) 
sw s2,24(sp) 
sw s1,20(sp) 
sw s0,16(sp) 


BOERS ET spk 748, re RHEL E12 All 
将 寄存 器 ra、s6、Ss5、s4、...s0 依 次 压 入 堆栈 。 如 图 15-6 所 示 。 这 样 在 函 
数 TaskStart 内 部 就 可 以 自由 使 用 寄存 器 ra、s6、s5、s4、...s0 了 。 


4. 叶子 函数 堆栈 布局 示例 


上 面 给 出 的 参数 传递 示例 、 函 数 返 回 值 示 例 都 是 叶子 函数 ， 所 以 此 
处 不 再 单独 给 出 叶子 函数 示例 。 从 那 两 个 示例 对 应 的 汇编 代码 可 以 发 
现 ， 叶 子 函 数 不 需 要 堆栈 (实际 上 ， 根 据 需 要 也 可 以 拥有 堆栈 ) ， 没 有 
要 保存 的 寄存 器 。 























高 地 址 
程序 进入 时 的 sp 
12 
个 
程序 运行 时 的 sp 
被 调用 函数 栈 
y 低地 址 


图 15-6 TaskStart 函 数 运行 时 的 堆栈 


15.11 RhC/OS-I 在 OpenMIPS 处 理 
El 


有 了 前 几 节 介绍 的 背景 知识 ， 现 在 就 可 以 开始 移植 HC/OS-I 到 
OpenMIPSAbEE AS J o 


根据 目标 处 理 器 的 不 同 ， 移 植 hC/OS-II 需 要 修改 50-300 行 代码 。 最 
方便 的 途径 是 修改 现 有 的 移植 代码 ， 比 如 本 章 要 将 hC/OS-II 移 植 到 
OpenMIPS 处 理 器 ， 那 么 可 以 借鉴 hC/OS-I 在 其 它 MIPS 架 构 处 理 器 上 的 
移植 代码 ， 在 其 基础 上 进行 修改 。 


15.111 文件 目录 的 建立 


本 小 市 将 建立 代码 文件 的 目录 ， 分 以 下 步骤 。 


1. 在 Ubuntu 虚拟 机 中 新 建文 件 严 ucosii_OpenMIPS， 作 为 整个 移植 
过 程 的 根 目 录 。 


2. 从 http://micrium.com/ 下 载 hC/OS-II 的 源 代码 ， 版 本 是 v2.91。 在 
本 书 附带 光盘 Code\ucosii sourcecode 目 录 下 也 提供 了 全 部 源 人 代码， 文件 
名 是 uCOS-IIL-V290.ZIP。 解 压缩 后 ， 包 含 的 代码 文件 如 图 15-7 所 示 。 


3. 在 ucosii OpenMIPS 目 录 下 新 建文 件 夹 cos， 将 hC/OS-II[ 源 代码 
的 文件 〈 除 了 os_cfg_r.h、ucos_iih 两 个 头 文 件 之 外 ) 复制 到 ucos 文 件 夹 
fe 

















ios afer. h os _dbe_ flag 3 
=4 je! = Œ E 
Be Br Be Br 
-q.c os sem.c _task. c t t u 


15-7 hnC/0S-11 源 代码 提供 的 文件 


4. 从 http://micrium.com/ 下 载 针 对 MIPS ”M14K 的 nC/OS-II 移 植 代 
14, WA tev2.90. APN HIG AE AY Code\ucosii_sourcecode H se F th. fe Ht 
了 移植 代码 ， 文 件 名 是 uCOS-IL_M14K.zip。MIPS MI14K 是 MIPS 科 技 于 
2009 年 发 布 的 首 款 执行 microMIPS 指 令 集 架构 的 MIPS32 兼 容 内 核 。 
microMIPS 指 令 集 架构 集成 了 16 位 和 32 位 优化 指令 的 高 性 能 代码 压缩 技 
术 ， 保 持 了 98% 的 MIPS32 性 能 ， 同 时 减少 了 至 少 30% 的 代码 体积 ， 从 而 
降低 蕊 片 成 本 ， 也 有 助 于 降低 系统 功 耗 。 本 章 的 移植 工作 就 是 在 针对 
MIPS MI14K 的 hC/OS-II 移 植 代码 的 基础 上 修改 完成 的 。 移 植 代码 的 文件 
如 图 15-8 所 示 。 注 意 : 这 几 个 文件 并 不 在 同一 个 文件 夹 下 ， 此 处 只 是 为 
了 显示 方便 而 将 其 复制 到 同一 个 文件 夹 下 。 


h) asm h) asm) = 


cpu. hi cpu_a.s os_cpu.h os cpu a.S oS cpuc.c 











图 15-8 ”针对 MIPS M14K 的 nC/0S-11 移 植 代码 


5. 在 ucosii_OpenMIPS 目 录 下 新 建文 件 夹 port， 将 针对 MIPS M14K 
的 nC/OS-II 移 植 代码 中 的 0s_cpu_a.S、os_cpu_c.c 两 个 文件 复制 到 该 文件 
EF. 


6. fEucosii OpenMIPS 目 录 下 新 建文 件 夹 include， 将 hnC/OS-IIT 源 代 
码 中 的 ucos_iih、os_cfg_rh 两 个 头 文 件 ， 以 及 针对 MIPS M14K 的 


hC/OS-II 移 植 代码 中 的 cpuh、os_cpuh 两 个 头 文件 ， 一 共 四 个 头 文 件 复 
制 到 该 文件 夹 下 ， 并 将 os_cfg_r.h 重 命名 为 os_cfg.h， 注 意 : 在 重 命 名 前 
需要 去 掉 该 文件 的 只 读 属性 ， 否 则 无 法 重 命名 。 





7. 在 include 目 录 下 新 建文 件 includes.h， 内 容 如 下 。 


#include <stdarg.h> 
#include <stddef.h> 
#include <limits.h> 


#include "ucos_ii.h" 


主要 是 因为 针对 MIPS M14K 的 nC/OS-II 移 植 代码 中 的 os_cpu_c.c 文 
件 需 要 引用 includes.h 文 件 ， 所 以 此 处 添加 该 文件 。 


8. 在 include 目 录 下 新 建文 件 app_cfg.h， 内 容 如 下 。 


Hifndef _APP_CFG_H_ 
#define _APP_CFG_H_ 


#define OS_TASK_TMR_PRIO (OS_LOWEST_PRIO - 2) 


#endif 


从 V2.81 版 本 开始 ，hC/OS-I 增 加 了 周期 性 〈Periodic) 和 一 次 性 
(One-Shot) 的 定时 器 功能 。 用 户 程序 最 多 可 以 使 用 65500 个 定时 器 ， 
这 些 定时 器 由 一 个 定时 器 管理 任务 进行 管理 ， 该 任务 的 优先 级 就 定义 在 
刚刚 新 建 的 app_cfg.h 文 件 中 ， 即 OS_TASK_TMR_PRIO。 





9. 修改 includes 目 录 下 的 cpuh 文 件 ， 去 掉 其 中 对 如 下 两 个 头 文 件 的 


引用 ， 因 为 移植 过 程 没 有 用 到 这 两 个 头 文件 。 


V SIU Ser a, 
#include <cpu_def.h> 


#include <cpu_cfg.h> 


.在 ucosii_OpenMIPS 目 录 下 新 建 common 文 件 夹 ， 其 中 用 于 存放 
we 


经 过 上 述 步 又 ， 就 建立 了 代码 文件 的 目录 ， 如 图 15-9 所 示 。 
需要 修改 部 分 代码 ， 主 要 是 修改 port 目 录 下 的 文件 以 及 os_cpu.h 文 件 ， 
实现 移植 hC/OS-I 到 OpenMIPS 处 理 器 。 in 
MIPS MR en 所 以 并 不 会 有 大 的 改动 ， 只 有 一 些 
细微 的 修改 ， 但 是 如 果 笔 者 只 介绍 这 些 细微 的 修改 ， 读 者 难免 会 有 盲人 
摸 象 的 感觉 ， 对 移植 需要 做 的 工作 、 移 植 的 原理 还 是 不 清楚 ， 所 以 ， 笔 
者 决定 详细 介绍 port 中 的 每 个 文件 以 及 os_cpu.h 文 件 ， 以 帮助 读者 理解 。 











ucosii_ OpenMIPS 








— p Ucos 包含 uC/OS-II 源 代码 的 大 部 分 文件 











OS_COre.C 
os_dbg fc 
os_flag.c 
os_mbox.c 
os_mem.c 
os_mutex.c 
— 0S q.C 

os_sem.c 
os_task.c 
os_time.c 
os_tmr.c 
ucos_ii.c 








> port 包含 与 具体 处 理 器 有 关 的 源 代码 文件 











os_cpu_a.S 
OS_cpu_c.c 











c p include 包含 头 文件 











app_cfg.h 
cpu.h 
includes.h 
os_cfg.h 
os_cpu.h 
ucos_ii.h 


> common 包含 用 户 程序 


图 15-9 ”代码 文件 的 目录 








15.11.2 ”修改 os_cpu.h 文 件 


os_cpu.h 文 件 定 义 了 与 处 理 絮 相关 的 常量 、 宏 、 结 构 体 。 主 要 内 容 


如 下 ， 完 全 可 以 使 用 针对 MIPS M14K 的 移植 代码 ， 不 用 修改 。 
1. 数据 类 型 定义 


因为 不 同 的 处 理 器 有 不 同 的 字 长 ， 所 以 hC/OS-I 包 含 了 一 系列 的 数 
据 类 型 定义 ， 以 确保 其 可 移植 性 。 尤 其 是 ，hC/OS-I 代 码 从 不 使 用 C 语 
言 中 的 short、int、long 等 数据 类 型 ， 因 为 它们 是 与 编译 器 相关 的 ， 是 不 
可 移植 的 。hC/OS-I 使 用 自己 定义 的 数据 类 型 ， 如 下 所 示 。 





[FREE RARA RAR 数据 类 型 定义 ， 与 编译 器 有 关 REE BIR EE RS 
typedef unsigned char BOOLEAN; 

typedef unsigned char INT8U; /* 无 符号 8 位 整数 */ 

typedef signed char INT8S; /* 有 符号 8 位 整数 */ 

typedef unsigned short INT16U; /* 无 符号 16 位 整数 */ 

typedef signed short INT16S; /* 有 符号 16 位 整数 */ 

typedef unsigned int INT32U; /* 无 符号 32 位 整数 */ 

typedef signed int INT32S; /* 有 符号 32 位 整数 */ 

typedef float FP32; 

typedef double FP64; 

typedef unsigned int OS_STK; /* 堆栈 宽度 ， 是 3 
typedef unsigned int volatile OS_CPU_SR; 





tkan, ake A EE as i PES A Aint HR SIE MA 
short， 那 么 只 需要 将 INT16S 前 面 的 的 short 改 为 int 即 可 ， 不 用 修改 
hC/OS-II 的 其 余 代 码 ， 以 此 确保 可 移植 性 。 


2. 进 、 出 临界 区 的 宏 


如 果 某 操作 不 希望 被 打 断 ， 那 么 可 将 该 操作 放 入 临界 区 中 ，pC/OS- 
I 在 进入 临界 区 之 前 要 禁止 中 断 ， 操 作 完毕 后 ， 退 出 临界 区 需要 开 中 
断 。hC/OS-I 定 义 了 两 个 宏 来 进入 临界 区 、 退 出 临界 区 ， 其 中 就 分 别 实 
现 禁止 中 断 、 开 中 断 。 这 两 个 宏 的 定义 如 下 。 





其 中 OS CPU SR Save、OS _ CPU SR Restore 两 个 函数 在 文件 
os_cpu_a.S 中 定义 ， 会 在 15.11.3 节 介绍 这 两 个 函数 。 


有 了 这 两 个 宏 ， 执 行 临界 区 代码 的 过 程 如 下 。 





3. 定义 堆栈 生长 方向 


大 多 数 处 理 器 的 堆栈 是 从 高 地 址 向 低地 址 生长 的 ， 但 也 有 部 分 处 理 





需 相 反 。hC/OS-I 被 设计 成 对 这 两 种 情况 都 可 以 处 理 ， 只 要 配置 如 下 的 
宏 定 义 即 可 。 


#define 0S_STK_GROWTH 1 





当 OS_STK_GROWTH 等 于 1 时 ， 表 示 堆 栈 的 生长 方向 是 从 高 地 址 问 
低地 址 ， 当 OS_STK_GROWTH 等 于 0 时 ， 表 示 堆 栈 的 生长 方向 是 从 低地 
址 向 高 地 址 。 对 OpenMIPS 人 处理 器 而 言 ， 此 处 设置 为 1。 


4. 用 于 任务 切换 的 宏 定义 


#define OS _TASK_SW() asm("\tsyscall\n"); 


宏 定义 O0S_TASK_SW0 实 现 了 任务 切换 ， 是 在 hC/OS-I 从 低 优 先 级 
任务 切换 到 高 优先 级 任务 时 需 用 到 的 。 从 定义 中 可 以 发 现 该 宏 定 义 实际 
就 是 系统 调用 指令 syscall。 





假如 任务 TaskA 在 执行 过 程 中 ， 由 于 某 种 原因 需要 执行 任务 
TaskB， 且 TaskB 的 优先 级 高 于 TaskA， 那 么 可 以 在 TaskA 中 执行 任务 切 
换 宏 0OS_TASK_SW0O， 后 者 会 引发 系统 调用 异常 ， 进 入 异常 处 理 例 程 。 
在 异常 处 理 例 程 的 最 后 ，hC/OS-II 会 查找 当前 优先 级 最 高 的 就 绪 任 务 开 
始 执行 ， 于 是 就 会 执行 TaskB， 从 而 实现 了 低 优先 级 任务 向 高 优先 级 任 
务 的 切换 。 


5. 一 些 函数 声明 


os_cpu.h 文 件 的 最 后 给 出 了 一 些 函数 声明 ， 这 些 函 数 在 文件 
os_cpu_a.S 中 定义 ，15.11.3 小 节 会 详细 说 明 。 


void OSINtCtxSw(void); 


void 0SStartHighRdy(void); 


void ExceptionHandler (void); 

void InterruptHandler (void); 

void TickInterruptClear (void); 

void CoreTmrInit(CPU_INT32U tmr_reload); 
void TickISR(CPU_INT32U tmr_reload); 


0S_CPU_SR OS_CPU_SR_Save(void); 
void OS_CPU_SR_Restore(0S_CPU_SR); 


15.11.3 ”修改 os_cpu_a.S 文 件 


0s_cpu_a.S 文 件 定 义 了 异常 处 理 例 程 ， 此 外 还 定义 了 一 些 常数 、11 
个 函数 ， 如 下 。 


e OS_CPU_SR_Save 

e OS_CPU_SR_Restore 
e InterruptHandler 

e OSIntCtxSw 

e ExceptionHandler 

e OSStartHighRdy 

e TickInterruptClear 

e CoreImrlnit 

e TickISR 


e DisableInterruptSource 


e EnableInterruptSource 
分 别 介绍 如 下 。 


1. 异常 处 理 例 程 


其 中 定义 了 stack 段 、 定 义 了 腊 第 处 理 例 程 。 代 码 如 下 。 





nop 


y 


/**** 系统 调用 异常 、 无 效 指令 、 洲 出 异常 、 自 陷 异 常 ， 对 应 的 入 口 地 址 是 0x40 ** 





.Org 0x40 
la $26,ExceptionHandler 
jr $26 


nop 


上 述 代 码 很 好 理解 。 首 先 定 义 了 堆栈 段 ， 大 小 是 0x10000 字 节 。 然 
后 定义 了 vectors 段 ， 其 中 包括 三 个 异常 处 理 例 程 。 





(1) 复位 异常 ， 对 应 的 处 理 例 程 入 口 地 址 是 0x0。 在 其 中 初始 化 全 
局 指针 寄存 器 gp、 堆 栈 指针 寄存 器 Sp， 然后 转移 到 main 函 数 。 其 中 将 
_stack_addr 的 值 作为 sp 的 初始 值 ，_stack_addr 是 在 链接 指示 文件 ram.ld 中 
定义 的 《参考 15.13 节 ) ， 对 应 的 是 堆栈 的 最 高 地 址 。 





C2) 中 断 异 常 ， 对 应 的 处 理 例 程 入 口 地 址 是 0x20。 在 其 中 直接 转 
移 到 函数 InterruptHandler 进 行 中 断 处 理 。 读 者 可 能 会 有 疑问 ， 一 般 而 
言 ， 异 常 处 理 之 前 应 该 先 保 护 现 场 ， 即 保存 所 有 寄存 器 的 值 ， 此 处 在 没 
有 保护 现场 的 情况 下 就 使 用 了 寄存 器 $26， 会 不 会 出 问题 ? 保护 现场 的 
工作 在 函数 InterruptHandler 中 进行 ， 此 处 在 没有 保护 现场 的 情况 下 就 使 
用 了 寄存 器 $26， 是 因为 寄存 器 $26( 以 及 寄存 器 $27) 就 是 给 异常 处 理 
程序 使 用 的 ， 其 它 程序 不 使 用 ， 所 以 修改 了 也 没关系 ， 参 考 表 15-2。 





(3) 系统 调用 异常 、 无 效 指令 、 溢 出 异常 、 自 陷 异 第 ， 对 应 的 处 
理 例 程 入 口 地 址 是 0x40。 在 其 中 直接 转移 到 函数 ExceptionHandler 进 行 
异常 处 理 。 此 处 也 使 用 了 寄存 器 $26。 


需要 注意 的 是 ， 在 代码 中 使 用 了 la 指令 ， 这 
编译 器 有 关 的 指令 ， 用 来 将 





条 机 器 指令 。 


//la 指 令 用 来 将 指定 的 地 址 加 载 到 寄存 器 ， 等 价 于 


Re 


BEN Se Sk ak EFF a 


个 汇编 指令 ， 


是 与 
其 等 价 于 如 下 两 


两 条 机 器 指令 Z> uE, 


// 其 中 %hi(addr) 表 示 addr 的 高 16bit，%1Lo(addr) 表 示 addr 的 低 16bit 


Hts ate 


os_cpu_a.S 定 义 了 出 入 堆栈 使 用 到 的 一 些 常 


.edu 
.edu 
.edu 
.edu 
.edu 
.edu 
.edu 
.edu 
.edu 
.edu 
.edu 
.edu 
.edu 
.edu 


.equ 


addr 


=> lui 


STK_OFFSET_SR, 
STK_OFFSET_EPC, 
STK_OFFSET_LO, 
STK_OFFSET_HI, 
STK_OFFSET_GPR1, 
STK_OFFSET_GPR2, 
STK_OFFSET_GPR3, 
STK_OFFSET_GPR4, 
STK_OFFSET_GPR5, 
STK_OFFSET_GPR6, 
STK_OFFSET_GPR7, 
STK_OFFSET_GPR8, 
STK_OFFSET_GPRO, 


STK_OFFSET_GPR10, 
STK_OFFSET_GPR11, 


$2, 
addiu $2, $2, 


%hi(addr) 
%lo(addr) 


4 
STK_OFFSET_SR 
STK_OFFSET_EPC 
STK_OFFSET_LO 
STK_OFFSET_HI 
STK_OFFSET_GPR1 
STK_OFFSET_GPR2 
STK_OFFSET_GPR3 
STK_OFFSET_GPR4 
STK_OFFSET_GPR5 
STK_OFFSET_GPR6 
STK_OFFSET_GPR7 
STK_OFFSET_GPR8 
STK_OFFSET_GPR9 
STK_OFFSET_GPR10 


+ 


+ 


常数 定义 。 


>A AÀ A A A A A A A A A A Bb RA 


.edu 
.edu 
.edu 
.edu 
.edu 
.edu 
.edu 
.edu 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 


.equ 


STK_OFFSET_GPR12, 
STK_OFFSET_GPR13, 
STK_OFFSET_GPR14, 
STK_OFFSET_GPR15, 
STK_OFFSET_GPR16, 
STK_OFFSET_GPR17, 
STK_OFFSET_GPR18, 
STK_OFFSET_GPR19, 
STK_OFFSET_GPR20, 
STK_OFFSET_GPR21, 
STK_OFFSET_GPR22, 
STK_OFFSET_GPR23, 
STK_OFFSET_GPR24, 
STK_OFFSET_GPR25, 
STK_OFFSET_GPR26, 
STK_OFFSET_GPR27, 
STK_OFFSET_GPR28, 
STK_OFFSET_GPR30, 
STK_OFFSET_GPR31, 
STK_CTX_SIZE, 


STK_OFFSET_GPR11 
STK_OFFSET_GPR12 
STK_OFFSET_GPR13 
STK_OFFSET_GPR14 
STK_OFFSET_GPR15 
STK_OFFSET_GPR16 
STK_OFFSET_GPR17 
STK_OFFSET_GPR18 
STK_OFFSET_GPR19 
STK_OFFSET_GPR20 
STK_OFFSET_GPR21 
STK_OFFSET_GPR22 
STK_OFFSET_GPR23 
STK_OFFSET_GPR24 
STK_OFFSET_GPR25 
STK_OFFSET_GPR26 
STK_OFFSET_GPR27 
STK_OFFSET_GPR28 
STK_OFFSET_GPR30 
STK_OFFSET_GPR31 


+ 


6 */ 





从 常数 的 名 称 上 可 以 分 析 ， 这 些 常数 定义 了 对 应 的 寄存 器 在 堆栈 中 


的 位 置 (相对 于 sp 的 偏 移 ) ， 如 图 15-10 所 示 。 当 异常 发 生 时 ， 会 按照 
图 15-10 的 次 序 将 各 个 寄存 器 保存 到 堆栈 ， 在 后 文 解 释 函数 

InterruptHandler 时 会 详 述 。 另 外 ， 上 述 定 义 中 的 STK_CTX_SIZE 表 示 堆 
栈 的 大 小 。 


ERETTO 





sp y 低地 址 





图 15-10 寄存 器 在 堆栈 中 的 保存 位 置 
3. K%%OS_CPU_SR_Save 


作用 是 读 取 协 处 理 器 CP0 中 Status 寄 存 器 的 值 ， 同 时 禁止 中 断 ， 函 数 
声明 如 下 。 


该 函数 有 一 个 返回 值 ， 返 回 的 是 CP0 中 Status 寄 存 器 的 值 。 函 数 定义 
如 下 。 





and $3,$2,$3 # $3 与 $2 的 值 相 与 ， 结 果 保 存 到 $3 中 


mtcO $3,$12,0 # 修改 后 的 寄存 器 $3 的 值 保存 到 Status 寄 存 器 
jr $31 # 返回 
nop 


,end OS _CPU_SR_ Save 


首先 获取 当前 Status 寄 存 器 的 值 ， 保 存 到 寄存 器 Y0《〈 即 程序 中 的 
$2) 中 ， 然 后 修改 其 最 低位 为 0， 修 改 后 的 值 保 存 到 v1《〈 即 程序 中 的 
$3) 中 ， 再 将 v1 的 值 保 存 到 Status 寄 存 右 ， 由 于 v1 的 最 低位 为 0， 从 而 茶 
止 中 断 (参考 10.2 节 对 Status 寄 存 器 的 说 明 ) 。 最 后 返回 。 


根据 MIPS 函 数 调用 规范 可 知 ， 函 数 返 回 值 一 般 放 在 寄存 占 v0 中 ， 
而 此 时 v0 的 值 正 是 修改 之 前 Status 寄 存 器 的 值 。 满 足 规范 要 求 ， 达 到 了 
本 函数 的 目的 。 


4. Ki2XOS_CPU_SR_Restore 


作用 是 恢复 Status 寄 存 器 的 值 ， 函 数 声 明 如 下 ， 从 中 可 以 友 现 该 函 
数 有 一 个 传 入 参数 。 


void OS_CPU_SR_Restore(CPU_SR sr); 
BLE SUI F o 
.ent OS_CPU_SR_Restore 


OS_CPU_SR_Restore: 


jr $31 


N 
= 


mtcO $4, $12, 0 // 过 寄存 器 ag ( 即 $4) 传 入 的 


,end OS_CPU_SR_ Restore 





根据 MIPS 函 数 调 用 规范 可 知 ， 参 数 是 通过 寄存 器 a0-a3 (EN $4-$7) 
传递 的 ， 所 以 上 述 代码 很 好 理解 ， 将 传 入 参数 存储 到 协 处 理 器 CP0 中 的 
Status 寄 存 器 。 需 要 注意 的 是 ， 上 述 代 码 将 mtc0 指 令 放 在 延迟 槽 中 。 


通过 分 析 实 际 的 函数 ， 读 者 朋友 应 该 对 15.10 节 介绍 的 MIPS 函 数 调 
用 规范 有 了 更 加 深刻 的 理解 了 吧 。 


函数 InterruptHandIer 


在 前 文 定 义 的 中 断 处 理 例 程 中 ， 会 直接 转移 到 函数 
InterruptHandler， 进 行 中 断 处 理 ， 函 数 InterruptHandler 的 定义 如 下 。 


.ent InterruptHandler 


InterruptHandler: 


REE PSI ELIS TSAR EAE SA a SL a IER EAL AT SU EAL AP SOE EAE. a a EAL IR ad PAT OR E L ATO Cad Ee TES GRD SAS Nad Ra Na? Ma Nad NaS 人 


KKKKKKKKKKKKE 第 一 段 : 保护 现场 ， 寄存 器 压 栈 KKKKKKKKKKKKEKEK 


火炎 大大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 


addi $29, $29, -STK_CTX_SIZE /* 调整 堆栈 指针 */ 


SW $1, STK_OFFSET_GPR1($29) /* 保存 整数 寄存 器 */ 
SW $2, STK_OFFSET_GPR2($29) 
SW $3, STK_OFFSET_GPR3($29) 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


$4, 

$5, 

$6, 

$7, 

$8, 

$9, 

$10, 
$11, 
$12, 
$13, 
$14, 
$15, 
$16, 
$17, 
$18, 
$19, 
$20, 
$21, 
$22, 
$23, 
$24, 
$25, 
$26, 
$27, 
$28, 
$30, 
$31, 


STK_OFFSET_GPR4($29) 
STK_OFFSET_GPR5($29) 
STK_OFFSET_GPR6 ($29) 
STK_OFFSET_GPR7 ($29) 
STK_OFFSET_GPR8($29) 
STK_OFFSET_GPR9 ($29) 
STK_OFFSET_GPR10($29) 
STK_OFFSET_GPR11($29) 
STK_OFFSET_GPR12($29) 
STK_OFFSET_GPR13($29) 
STK_OFFSET_GPR14($29) 
STK_OFFSET_GPR15($29) 
STK_OFFSET_GPR16($29) 
STK_OFFSET_GPR17($29) 
STK_OFFSET_GPR18($29) 
STK_OFFSET_GPR19($29) 
STK_OFFSET_GPR20($29) 
STK_OFFSET_GPR21($29) 
STK_OFFSET_GPR22($29) 
STK_OFFSET_GPR23($29) 
STK_OFFSET_GPR24($29) 
STK_OFFSET_GPR25($29) 
STK_OFFSET_GPR26($29) 
STK_OFFSET_GPR27($29) 
STK_OFFSET_GPR28($29) 
STK_OFFSET_GPR30($29) 
STK_OFFSET_GPR31($29) 











mtlo $9 /* 恢复 寄存 器 HI */ 


lw $31, STK_OFFSET_GPR31($29) /* 恢复 整数 寄存 器 */ 
lw $30, STK_OFFSET_GPR30($29) 
lw $28, STK_OFFSET_GPR28($29) 
lw $27, STK_OFFSET_GPR27($29) 
lw $26, STK_OFFSET_GPR26($29) 
lw $25, STK_OFFSET_GPR25($29) 
lw $24, STK_OFFSET_GPR24($29) 
lw $23, STK_OFFSET_GPR23($29) 
lw $22, STK_OFFSET_GPR22($29) 
lw $21, STK_OFFSET_GPR21($29) 
lw $20, STK_OFFSET_GPR20($29) 
lw $19, STK_OFFSET_GPR19($29) 
lw $18, STK_OFFSET_GPR18($29) 
lw $17, STK_OFFSET_GPR17($29) 
lw $16, STK_OFFSET_GPR16($29) 
lw $15, STK_OFFSET_GPR15($29) 
lw $14, STK_OFFSET_GPR14($29) 
lw $13, STK_OFFSET_GPR13($29) 
lw $12, STK_OFFSET_GPR12($29) 
lw $11, STK_OFFSET_GPR11($29) 
lw $10, STK_OFFSET_GPR10($29) 
lw $9, STK_OFFSET_GPR9($29) 
lw $8, STK_OFFSET_GPR8($29) 
lw $7, STK_OFFSET_GPR7($29) 
lw $6, STK_OFFSET_GPR6($29) 





注意 其 中 使 用 到 的 汇编 指令 1i， 这 是 与 编译 器 有 关 的 指令 ， 用 来 将 
芯 即 数 加 载 到 寄存 器 ， 等 价 于 ori 指 令 ， 如 下 。 


另外 ， 其 中 部 分 and 指 令 采用 了 简化 方式 ， 如 下 ， 编 译 器 可 以 识 
别 。 在 后 面 还 会 遇 到 or 指令 ， 也 采用 了 类 似 的 简化 方式 。 


上 述 代 码 可 以 分 为 六 段 理解 。 
第 一 段 : 保护 现场 ， 也 就 是 将 各 个 寄存 器 的 值 保存 到 堆栈 ， 保 存 的 


格式 就 是 图 15-10 所 示 。 注 意 : 不 用 保存 堆栈 指针 寄存 器 Sp〈 即 $29) 。 





第 二 段 : 首先 获取 变量 OSIntNesting 的 值 ， 然 后 分 两 种 情况 。 





e 如 果 为 零 ， 那 么 需要 将 被 中 断 任 务 的 堆栈 指针 保存 到 该 任务 的 
任务 控制 块 〈 即 OSTCBCur) 中 。 参 考 15.5.1 节 给 出 的 任务 控 
制 块 的 结构 体 定 义 ， 其 第 一 个 元 素 就 是 堆栈 指针 ， 所 以 此 处 直 
接 将 寄存 器 sp 保存 到 OSTCBCur 指 向 的 地 址 ， 该 地 址 对 应 就 是 
任务 控制 块 中 的 堆栈 指针 这 个 元 素 。 然 后 将 变量 OSIntNesting 
加 1。 

e 如 采 不 为 去 ， 那 么 直接 将 变量 OSIntNesting 加 1。 


hC/OS-I 需 要 知道 正在 做 中 断 服务 ， 这 样 只 要 变量 OSIntNesting 不 
为 0， 就 表示 处 于 中 断 处 理 过 程 中 。 





第 三 段 ， 中 断 处 理 过 程 。 读 取 Cause 寄 存 器 的 值 ， 获 得 其 中 的 卫 字 
段 ， 该 字段 位 于 Cause 寄 存 器 的 第 8-15bit。 然 后 判断 IP 字 上 段 中 是 否 有 1， 
有 1 就 表示 有 中 断 发 生 ， 那 么 会 进入 具体 的 中 断 处 理 函 数 
BSP_Interrupt_Handler 进 行 处 理 ， 该 函数 在 os_cpu_c.c 中 定义 ， 会 在 
15.11.4 节 详细 说 明 。 中 断 处 理 结束 后 ， 还 要 再 次 判断 是 否 有 中 断 发 生 ， 
如 果 还 有 中 断 ， 那 么 再 次 进入 函数 BSP_Interrupt_Handler 进 行 处 理 ， 如 
此 反复 ， 直 到 没有 中 断 为 止 。 











第 四 段 : 中 断 处 理 结束 ， 此 时 需要 调用 函数 OSIntExit。OSIntExit 会 
将 变量 OSIntNesting 减 1， 当 OSIntNesting 减 到 0 时 ， 表 示 所 有 蔡 套 的 中 断 
都 处 理 结束 。 此 时 ，hC/OS-I 需 要 判断 是 否 有 更 高 优先 级 的 任务 进入 就 
绪 态 (中 断 处 理 过 程 可 能 会 唤醒 更 高 优先 级 的 任务 ) 。 如 果 有 ， 那 么 就 
调用 函数 OSIntCtxSw 以 实现 切换 到 优先 级 更 高 的 任务 继续 执行 ， 反 之 ， 








回 到 原来 被 中 断 的 任务 。 其 过 程 如 图 15-11 所 示 。 





将 变量 OSIntNesting 减 1 


一 一 oOSIntNesting 为 0， 是 有 更 高 优先 级 的 任务 处 于 就 绪 态 “和 否 证 返回 























e 一 

















函数 OSIntCtxSW， 切 换 到 高 优先 级 的 任务 


Si 














图 15-11 ”函数 0S1ntExit 的 处 理 流程 


国 数 OSIntExit 是 在 文件 os_core.c 中 定义 的 ， 无 需 修 改 。 图 15-11 中 的 
国 数 OSIntCtxSw 是 在 文件 os_cpu_a.S 中 定义 的 ， 本 节 接 下 来 会 介绍 该 函 
数 。 


第 五 段 : 从 堆栈 中 恢复 各 个 寄存 器 的 值 。 注 意 : 不 用 恢复 寄存 器 
sp (BH$29) 。 


第 六 段 : 调用 指令 eret 实 现 返 回 。 指 令 eret 会 将 寄存 器 EPC 的 值 赋 给 
取 指 寄存 器 PC， 作 为 新 的 取 指 地 址 。 





再 进一步 思考 ， 如 果 第 四 段 中 ， 满 足 “OSIntNesting 为 0， 且 有 更 高 
优先 级 的 任务 处 于 就 绪 态 ”这 个 条 件 ， 那 么 会 切换 到 更 高 优先 级 的 任务 
继续 执行 ， 而 当前 被 中 断 的 任务 就 会 进入 就 绪 态 ， 该 任务 的 堆栈 指针 sp 
存放 在 其 任务 控制 块 中 ， 在 堆栈 中 保存 了 所 有 寄存 器 的 值 ， 如 图 15-12 
所 示 。 实 际 上 ， 这 就 是 处 于 就 绪 态 的 任务 的 普遍 状态 ， 有 了 这 个 认识 ， 
就 比较 容易 理解 下 面 将 要 解释 的 函数 OSIntCtxSw。 




















任务 控制 块 EPC 
sp SR 低地 址 




















图 15-12 ”就 绪 态 任务 的 普遍 状态 


6. 函数 OSIntCtxSw 


函数 OSIntCtxSw 的 作用 在 图 15-11 中 已经 提 到 ， 简 单 来 说 ， 就 是 切 
换 到 高 优先 级 的 任务 继续 执行 。 代 人 码 如 下 所 示 。 








lw $8, STK_OFFSET_LO($29) 
lw $9, STK_OFFSET_HI($29) 
mtlo $8 /* 恢复 寄存 器 LO */ 
mthi $9 /* 恢复 寄存 器 HI */ 


lw $31, STK_OFFSET_GPR31($29) /* 恢复 整数 寄存 器 */ 
lw $30, STK_OFFSET_GPR30($29) 
lw $28, STK_OFFSET_GPR28($29) 
lw $27, STK_OFFSET_GPR27($29) 
lw $26, STK_OFFSET_GPR26($29) 
lw $25, STK_OFFSET_GPR25($29) 
lw $24, STK_OFFSET_GPR24($29) 
lw $23, STK_OFFSET_GPR23($29) 
lw $22, STK_OFFSET_GPR22($29) 
lw $21, STK_OFFSET_GPR21($29) 
lw $20, STK_OFFSET_GPR20($29) 
lw $19, STK_OFFSET_GPR19($29) 
lw $18, STK_OFFSET_GPR18($29) 
lw $17, STK_OFFSET_GPR17($29) 
lw $16, STK_OFFSET_GPR16($29) 
lw $15, STK_OFFSET_GPR15($29) 
lw $14, STK_OFFSET_GPR14($29) 
lw $13, STK_OFFSET_GPR13($29) 
lw $12, STK_OFFSET_GPR12($29) 
lw $11, STK_OFFSET_GPR11($29) 
lw $10, STK_OFFSET_GPR10($29) 





上 述 代 码 可 以 分 为 四 段 理解 。 


BE: 调用 钩子 函数 OSTaskSwHook， 该 函数 在 文件 os_cpu_c.c 中 
定义 ， 默 认为 空 ， 用 户 可 以 在 其 中 填充 自己 的 代码 ， 每 次 任务 切换 都 会 
调用 该 函数 。 

第 二 段 : 更 新 当前 任务 的 优先 级 ODSPrioCur 及 其 任务 控制 块 指针 
OSTCBCur 这 两 个 变量 ， 分 别 等 于 目前 处 于 就 绪 态 的 具有 最 高 优先 级 的 


任务 的 优先 级 ODSPrioHighRdy 及 其 任务 控制 块 指针 OSTCBHighRdy。 


第 三 段 : 恢复 新 任务 的 寄存 如 。 从 图 15-12 可 知 ， 就 绪 态 任务 的 堆 
栈 指 针 融 是 任务 控制 块 的 第 一 个 元 际 ， 所 以 可 以 从 任务 控制 块 中 获取 挫 
栈 指 针 。 之 后 ， 从 堆栈 中 恢复 各 个 寄存 器 。 


第 四 段 : 使 用 指令 eret 返 回 ， 指 令 eret 会 将 寄存 器 EPC 的 值 赋 给 取 指 
寄存 器 PC， 作 为 新 的 取 指 地 址 。 


如 此 就 实现 了 任务 切换 。 


7. pk ExceptionHandler 





在 前 文 定义 的 系统 调用 异常 、 无 效 指令 、 淤 出 异常 、 自 陷 异 常 的 处 
理 例 程 中 ， 会 直接 转移 到 函数 ExceptionHandler， 进 行 异常 处 理 。 函 数 
ExceptionHandler 的 定义 如 下 。 


.ent ExceptionHandler 


ExceptionHandler: 


JIS ed od EERE EE ALN BPE RARE RAS Ak Ta oN RA od Rak AR BaT Ek BALMS Ed ak Rak SAB) EAR BARR Bd EAR RAL GAR Gk GAR Ak AS EAR Bak Ak BAT CAE rad GE AE EAR Rad GSP RAS ES PRS oa 


KKKKKKKKKKKKE 第 一 段 : 保护 现场 ， 寄存 器 压 栈 KKKKKKKKKKKKKE 


火炎 火炎 大大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 


addi $29, $29, -STK_CTX_SIZE /* 调整 堆栈 指针 */ 


SW $1, STK_OFFSET_GPR1($29) /* 保存 整数 寄存 器 */ 
SW $2, STK_OFFSET_GPR2($29) 
SW $3, STK_OFFSET_GPR3($29) 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


$4, 

$5, 

$6, 

$7, 

$8, 

$9, 

$10, 
$11, 
$12, 
$13, 
$14, 
$15, 
$16, 
$17, 
$18, 
$19, 
$20, 
$21, 
$22, 
$23, 
$24, 
$25, 
$26, 
$27, 
$28, 
$30, 
$31, 


STK_OFFSET_GPR4($29) 
STK_OFFSET_GPR5($29) 
STK_OFFSET_GPR6 ($29) 
STK_OFFSET_GPR7 ($29) 
STK_OFFSET_GPR8($29) 
STK_OFFSET_GPR9 ($29) 
STK_OFFSET_GPR10($29) 
STK_OFFSET_GPR11($29) 
STK_OFFSET_GPR12($29) 
STK_OFFSET_GPR13($29) 
STK_OFFSET_GPR14($29) 
STK_OFFSET_GPR15($29) 
STK_OFFSET_GPR16($29) 
STK_OFFSET_GPR17($29) 
STK_OFFSET_GPR18($29) 
STK_OFFSET_GPR19($29) 
STK_OFFSET_GPR20($29) 
STK_OFFSET_GPR21($29) 
STK_OFFSET_GPR22($29) 
STK_OFFSET_GPR23($29) 
STK_OFFSET_GPR24($29) 
STK_OFFSET_GPR25($29) 
STK_OFFSET_GPR26($29) 
STK_OFFSET_GPR27($29) 
STK_OFFSET_GPR28($29) 
STK_OFFSET_GPR30($29) 
STK_OFFSET_GPR31($29) 








lw $21, STK_OFFSET_GPR21($29) 
lw $20, STK_OFFSET_GPR20($29) 
lw $19, STK_OFFSET_GPR19($29) 
lw $18, STK_OFFSET_GPR18($29) 
lw $17, STK_OFFSET_GPR17($29) 
lw $16, STK_OFFSET_GPR16($29) 
lw $15, STK_OFFSET_GPR15($29) 
lw $14, STK_OFFSET_GPR14($29) 
lw $13, STK_OFFSET_GPR13($29) 
lw $12, STK_OFFSET_GPR12($29) 
lw $11, STK_OFFSET_GPR11($29) 
lw $10, STK_OFFSET_GPR10($29) 
lw $9, STK_OFFSET_GPR9($29) 
lw $8, STK_OFFSET_GPR8($29) 
lw $7, STK_OFFSET_GPR7($29) 
lw $6, STK_OFFSET_GPR6($29) 
lw $5, STK_OFFSET_GPR5($29) 
lw $4, STK_OFFSET_GPR4($29) 
lw $3, STK_OFFSET_GPR3($29) 
lw $2, STK_OFFSET_GPR2($29) 
lw $1, STK_OFFSET_GPR1($29) 


addi $29, $29, STK_CTX_SIZE /* 调整 堆栈 指针 */ 


VARAS 


炎炎 炎炎 火炎 类 类 炎炎 类 类 大 UES: 返回 KKKKKKKKKKKKKKE 


类 炎炎 炎炎 炎炎 类 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 类 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 火炎 火炎 炎炎 炎炎 炎炎 炎炎 炎炎 火炎 


eret 2 za LE 7 


.end ExceptionHandler 


函数 ExceptionHandler 与 函数 InterruptHandler 的 内 容 大 致 一 样 ， 但 是 
更 加 简单 ， 可 分 为 四 段 理解 。 


第 一 段 : 保护 现场 ， 就 是 将 各 个 寄存 器 保存 到 堆栈 ， 同 时 将 当前 任 
务 的 堆栈 指针 sp( 即 寄存 器 $29) 保存 到 任务 控制 块 OSTCBCur 中 ， 保 存 
后 的 格式 就 是 图 15-12 所 示 。 


第 二 7 段 ， 调用 具体 的 异常 处 理 函 数 BSP_Exception_Handler 进 行 异常 
处 理 。 该 函数 在 文件 os_cpu_c.c 中 定义 ， 在 15.11.4 节 会 有 详细 说 明 。 其 
中 将 进行 任务 切换 。 


第 三 段 ， 由 于 在 函数 BSP_Exception_Handler 中 会 进行 任务 切换 ， 所 
以 从 函数 BSP_Exception_Handler 返 回 后 ，OSTCBCur 可 能 不 是 指 同 被 异 
第 打 断 的 任务 的 任务 控制 块 。 不 管 是 不 是 ， 都 要 从 OSTCBCur 中 获得 将 
要 执行 的 任务 的 堆栈 指针 ， 然 后 依据 该 堆栈 指针 恢复 各 个 寄存 器 。 


第 四 段 : 使 用 指令 eret 返 回 ，eret 会 将 寄存 器 EPC 的 值 赋 给 取 指 寄存 
器 PC， 作 为 新 的 取 指 地 址 。 


8. 函数 OSStartHighRdy 


hC/OS-II 在 局 动 前 要 至 少 创建 一 个 任务 ， 新 创建 的 任务 处 于 就 绪 
态 。 然 后 HC/OS-II 可 以 调用 函数 OSStart 实 现 启动 。OSStart 从 任务 就 绪 表 
中 找 出 用 户 建立 的 优先 级 最 高 的 任务 ， 并 调用 函数 OSStartHighRdy 以 执 





行 该 优先 级 最 高 的 任务 。OSStartHighRdy 的 代码 如 下 。 








从 代码 上 分 析 ， 函 数 OSStartHighRdy 的 主要 工作 就 是 从 当前 最 高 优 








先 级 的 任务 的 堆栈 恢复 各 个 寄存 器 。 这 一 过 程 与 之 前 介绍 的 函数 
OSIntCtxSw 是 一 样 的 ， 两 者 的 代码 也 极为 相似 。 可 以 分 为 四 段 理解 。 


第 一 段 : 调用 钩子 函数 OSTaskSwHook， 该 函数 在 文件 os_cpu_c.c 中 
定义 ， 其 内 容 默认 为 衬 ， 用 户 可 以 填充 自己 的 代码 。 


PR: 设置 操作 系统 运行 标志 OSRunning 为 True〈 即 1) ， 表 示 操 
VE RIT aR AT T 





第 三 段 : 恢复 处 于 就 绪 态 的 上 共有 最 高 优先 级 的 任务 的 寄存 器 。 从 图 
15-12 可 知 ， 就 绪 态 任务 的 堆栈 指针 放 在 任务 控制 块 中 ， 所 以 首先 从 任 
务 控制 块 中 获取 堆栈 指针 ， 然 后 可 以 从 堆栈 中 恢复 各 个 寄存 器 





第 四 段 : 使 用 jr 指 令 返 回 。 这 一 点 是 ie enna 
同 ， 后 者 使 用 eret 指 令 返 回 ， 进 入 新 任务 执行 。 而 此 处 是 使 用 jr 指令 进 
新 任务 执行 。 这 是 因为 在 新 任务 创建 的 时 候 ， de 
在 寄存 器 $31 中 ， 所 以 此 处 使 用 jr ”$31 指 令 ， 就 会 转移 到 新 任务 开始 执 
行 。 读 者 在 阅读 15.11.4 节 解释 函数 OSTaskStkInit 的 时 候 ， 能 够 对 此 有 更 
直观 的 体会 。 


9. 函数 TickInterruptClear 


当 协 处 理 器 CP0 中 的 Compare 寄 存 器 等 于 Count 寄 存 器 时 ， 会 引发 时 
钟 中 断 ， 时 钟 中 断 会 持续 声明 ， 直 到 修改 了 Compare 寄 存 右 的 值 。 函 数 
TickInterruptClear 的 作用 就 是 通过 将 Compare 寄 存 器 置 为 0， 从 而 清除 时 
钟 中 断 声 明 。 其 代码 如 下 。 


.ent TickInterruptClear 


TickInterruptClear: 





10. &X&3XCoreTmrlnit 


本 函数 负责 初始 化 定时 器 ， 也 就 是 设置 Compare 寄 存 器 的 值 ， 同 时 
将 Count 寄 存 器 清 零 。 函 数 声 明 如 下 ， 从 中 可 知 该 函数 有 一 个 输入 参数 
tmr_reload, HIER ER Compare A fF a8 HVE o 


函数 代码 如 下 。 其 中 将 寄存 器 $4 的 值 赋 给 寄存 器 Compare， 参 考 
15.10.2 节 MIPS 函 数 调 用 中 的 参数 传递 规范 可 知 ， 寄 存 器 $4 中 保存 的 就 
是 传 入 的 参数 tmr_reload。 





11. 函数 TickISR 


中 断 发 生 时 会 调用 函数 BSP_Interrupt_Handler 进 行 处 理 ， 如 果 是 时 
钟 中 断 ， 那 么 会 进一步 调用 本 函数 TickISR 进 行 处 理 ， 其 作用 是 增加 
Compare 寄 存 器 的 值 ， 这 样 不 仅 清 除了 时 钟 中 断 声 明 ， 而 且 新 加 的 数值 
还 确定 了 下 一 次 时 钟 中 断 的 发 生 时 刻 〈 当 寄存 器 Count 等 于 寄存 器 
Compare 的 新 值 时 ， 又 会 发 生 时 钟 中 断 ) . GAO, MP RAZ 
函数 有 一 个 输入 参数 tmr_reload， 了 就 是 要 给 寄存 器 Compare 增 加 的 值 。 


函数 代码 如 下 。 








jr $31 /* 返回 */ 


,end TickISR 
上 述 代码 可 以 分 为 五 段 理 解 。 


第 一 段 : 因为 在 尔 数 中 又 要 调用 函数 OSTimeTick， 所 以 需要 保存 
部 分 寄存 器 。 首 先 将 堆栈 指针 sp 加 下 移 ， 预 留 24 个 字 节 的 空间 。 然 后 ， 
把 函数 中 使 用 到 的 寄存 器 $8、$16、$31 保 存 到 堆栈 。 


第 二 段 ， 获取 Compare 寄 存 器 的 当前 值 ， 然 后 与 寄存 器 $4 相 加 ， 加 
法 的 结果 再 保存 回 Compare 寄 存 器 。 参 考 15.10.2 节 MIPS 函 数 调用 中 的 参 
数 传 递 规范 可 知 ， 寄 存 器 $4 中 保存 的 就 是 传 入 参数 tmr_reload。 


第 三 段 ， 调用 函数 OSTimeTick， 以 通知 操作 系统 有 一 个 时 钟 中 断 
发 生 ， 该 函数 不 需 修改 。 





第 四 段 : 从 堆栈 恢复 保存 的 寄存 器 。 
第 五 段 : 返回 。 


截止 到 目前 ， 已 经 提 到 了 好 几 个 与 中 断 有 关 的 处 理 函 数 ， 包 括 
InterruptHandler, BSP_Interrupt_Handler, OSIntExit, OSIntCtxSw, 
TickISR 等 ， 其 中 函数 OSIntExit 位 于 hC/OS-I 中 与 处 理 器 无 关 的 部 分 ， 无 
需 修 改 ， 函 数 BSP_Interrupt_Handler 将 在 15.11.4 节 介绍 ， 其 余 的 3 个 函数 
都 已 介绍 ， 读 者 可 能 觉得 它们 之 间 的 关系 比较 混乱 ， 在 此 做 一 说 明 。 这 
几 个 函数 的 关系 如 图 15-13 所 示 。 





InterruptHandler 


























BSP_Interrupt_Handler 
TickISR 
‚org 0x20 
la $26,InterruptHandler > 
jr $26 
nop OSIntExit 
OSIntCtxSw 


























图 15-13 ”中断 处 理 相关 函数 的 关系 





中 断 发 生 时 ， 首 先 转移 到 0x20 处 ， 然 后 跳 转 到 函数 
InterruptHandler， 在 其 中 调用 函数 BSP_Interrupt_Handler 按 照 中 断 种 类 
进行 具体 处 理 ， 如 有 果 是 时 钟 中 断 ， 那 么 还 要 调用 函数 TickISR 以 清除 时 
钟 中 断 声 明 ， 同 时 设置 下 一 次 时 钟 中 断 的 发 生 时 刻 。 从 函数 
BSP_JInterrupt_Handler 返 回 到 InterruptHandler 后 ， 会 再 调用 函数 
OSIntExit， 如 果 全 局 变量 OSIntNesting 为 0， 且 有 更 高 优先 级 的 任务 处 于 
就 绪 态 ， 那 么 还 会 调用 函数 OSIntCtxSw 进 行 任务 切换 ， 反 之 ， 返 回 到 函 
数 InterruptHandler， 恢 复 被 中 断 的 任务 继续 执行 。 上 述 束 是 中 断 处 理 过 
程 涉 及 到 的 主要 函数 的 关系 。 





函数 DisabIeInterruptSource 


本 函数 的 作用 是 通过 设置 Status 寄 存 器 中 IM 了 字段 指定 位 为 0， 从 而 茶 
止 指 定 的 外 部 中 断 。 函 数 声 明 如 下 。 





void DisableInterruptSource(CPU_INT32U int_source); 


函数 代码 如 下 。 其 中 将 寄存 器 $4 的 值 与 Compare 寄 存 器 相 与 ， 结 果 
再 保存 回 Compare 寄 存 器 ， 参 考 15.10.2 节 MIPS 函 数 调用 的 参数 传递 规范 
可 知 ， 寄 存 堪 $4 中 保存 的 就 是 传 入 的 参数 int_source。 


.ent DisableInterruptSource 


DisableInterruptSource: 


mfco $8, $12 /* 获取 Status 寄 存 器 的 值 */ 
and $8, $4 /* 与 传 入 的 参数 相 与 */ 

mtco $8, $12 /* 结果 再 保存 回 Status 寄 存 器 */ 
jr $31 

nop 


.end DisableInterruptSource 


13. 函数 EnableInterruptSource 





本 函数 的 作用 是 通过 设置 Status 寄 存 器 中 IM 了 字段 指定 位 为 1， 从 而 使 
能 指定 的 外 部 中 断 。 函 数 声 明 如 下 。 


void EnableInterruptSource(CPU_INT32U int_source); 


函数 代码 如 下 。 其 中 将 寄存 器 $4 的 值 与 Compare 寄 存 器 相 或 ， 结 
再 保存 回 Compare 寄 存 器 ， 参 考 15.10.2 节 MIPS 函 数 调用 的 参数 传递 规范 
可 知 ， 和 寄存 器 $4 中 保存 的 就 是 传 入 的 参数 int_source。 


.ent DisableInterruptSource 


DisableInterruptSource: 


mfco $8, $12 /* 获取 Status 寄 存 器 的 值 */ 


or $8, $4 /* 与 传 入 的 参数 相 或 */ 

mtco $8, $12 /* 结果 再 保存 回 Status 寄 存 器 */ 
jr $31 

nop 


.end DisableInterruptSource 


本 节 给 出 的 代码 位 于 本 书 附带 光盘 
Code\Chapter15\ucosii_OpenMIPS\port 目 录 下 的 同名 文件 中 。 


15.11.4 ”修改 os_cpu_c.c 文 件 


移植 过 程 最 后 一 个 要 修改 的 文件 是 0s_cpu_c.c， 从 后 级 就 可 以 知道 
这 是 一 个 C 语 言 文件 。 包 括 如 下 几 个 函数 。 


e OSInitHookBegin 
e OSInitHookEnd 

e OSTaskCreateHook 
e OSTaskDelHook 

e OSTaskReturnHook 
e OSTaskIdleHook 

e OSTaskStatHook 

e OSTaskSwHook 

e OSTCBInitHook 

e OSTimeTickHook 
e OSTaskStklnit 


e BSP_Interrupt_Handler 
e BSP_Exception_Handler 





其 中 ， 函 数 名 有 “Hook” 单 词 的 表示 该 函数 是 一 个 钩子 图 数 ， 这 类 函 
数 的 内 容 可 以 保持 为 空 ， 移 植 过 程 中 不 需要 修改 ， 本 节 不 再 提 及 。 只 解 
释 最 后 三 个 函数 。 


1. K%XOSTaskStklnit 


函数 OSTaskStkInit 被 函数 OSTaskCreate 或 者 函数 OSTaskCreateExt 调 
用 ， 用 来 初始 化 即将 创建 的 任务 的 堆栈 。 函 数 声明 如 下 。 


OS_STK *OSTaskStkInit (void (*task)(void *pd), 
void *p_arg, 
OS_ STK *ptos, 
INT16U opt); 


从 中 可 以 发 现 有 四 个 参数 ， 分 别 如 下 。 

(1) task: 指向 任务 的 执行 代码 。 

(2) p_arg: 指向 用 户 提供 的 一 段 内 存 区 域 。 
(3) ptos: 指向 堆栈 顶部 。 

(4) opt: 一 些 特殊 选项 。 


函数 OSTaskStkInit 的 返回 值 是 堆栈 栈 顶 地 址 。 本 函数 用 来 初始 化 即 
将 创建 的 任务 的 堆栈 ， 而 hC/OS-I 中 新 创建 的 任务 处 于 就 绪 态 ， 其 堆栈 
结构 应 该 如 图 15-10 所 示 。 有 了 这 个 知识 ， 束 容易 理解 函数 


OSTaskStkInit 了 ， 其 代码 如 下 。 





/* khC/0S-II 的 堆栈 是 从 高 地 址 向 低地 址 生长 的 ， 下 面 的 代码 中 ，pstk 依 次 降低 ， 
的 初始 值 ， 这 些 值 对 应 图 15-10 中 的 各 个 寄存 器 ， 其 中 大 部 分 寄存 器 的 初始 值 者 
pas */ 


pstk--; 

*pstk-- = (INT32U)task; /* 整数 寄存 器 $31 */ 
*pstk-- = (INT32U)0x30303030; /* 整数 寄存 器 $30 */ 
*pstk-- = gp_val; /* 整数 寄存 器 $28 */ 
*pstk-- = (INT32U)0x27272727; /* 整数 寄存 器 $27 */ 
*pstk-- = (INT32U)0x26262626; /* 整数 寄存 器 $26 */ 
*pstk-- = (INT32U)0x25252525; /* 整数 寄存 器 $25 */ 
*pstk-- = (INT32U)0x24242424; /* 整数 寄存 器 $24 */ 
*pstk-- = (INT32U)0x23232323; /* 整数 寄存 器 $23 */ 
*pstk-- = (INT32U)0x22222222; /* 整数 寄存 器 $22 */ 
*pstk-- = (INT32U)0x21212121; /* 整数 寄存 器 $21 */ 
*pstk-- = (INT32U)0x20202020; /* 整数 寄存 器 $20 */ 
*pstk-- = (INT32U)0x19191919; /* 整数 寄存 器 $19 */ 
*pstk-- = (INT32U)0x18181818; /* 整数 寄存 器 $18 */ 
*pstk-- = (INT32U)0x17171717; /* 整数 寄存 器 $17 */ 
*pstk-- = (INT32U)0x16161616; /* 整数 寄存 器 $16 */ 
*pstk-- = (INT32U)0x15151515; /* 整数 寄存 器 $15 */ 
*pstk-- = (INT32U)0x14141414; /* 整数 寄存 器 $14 */ 
*pstk-- = (INT32U)0x13131313; /* 整数 寄存 器 $13 */ 
*pstk-- = (INT32U)0x12121212; /* 整数 寄存 器 $12 */ 
*pstk-- = (INT32U)0x11111111; /* 整数 寄存 器 $11 */ 
*pstk-- = (INT32U)0x10101010; /* 整数 寄存 器 $10 */ 


*pstk-- = (INT32U)0x09090909; /* 整数 寄存 器 $9 */ 


*pstk-- = (INT32U)0x08080808; /* 整数 寄存 器 $8 */ 





*pstk-- = (INT32U)0x07070707; /* 整数 寄存 器 $7 */ 

*pstk-- = (INT32U)0x06060606; /* 整数 寄存 器 $6 */ 

*pstk-- = (INT32U)0x05050505; /* 整数 寄存 器 $5 */ 

*pstk-- = (INT32U)0x04040404; /* 整数 寄存 器 $4 */ 

*pstk-- = (INT32U)0x03030303; /* 整数 寄存 器 $3 */ 

*pstk-- = (INT32U)0x02020202; /* 整数 寄存 器 $2 */ 

*pstk-- = (INT32U)0x01010101; /* 整数 寄存 器 $1 */ 

*pstk-- = (INT32U)0x00000000; /* 寄存 器 HI */ 

*pstk-- = (INT32U)0x00000000; /* 寄存 器 LO */ 

*pstk-- = (INT32U)task; /* 寄存 器 EPC */ 

*ostk-- = sr_val; /* 寄存 器 SR */ 

return ((OS_STK *)pstk); /* 返回 值 就 堆栈 的 栈 顶 地 址 */ 
} 

详细 注释 在 程序 中 已 经 给 出 ， 不 再 重复 说 明 ， 只 提醒 读者 注意 一 
点 ， 此 处 将 新 任务 的 入 口 地 址 task 存 放 到 堆栈 中 对 应 整数 寄存 器 $31 的 位 





置 ， 所 以 上 一 节 解 释 的 函数 OSStartHighRdy 可 以 在 最 后 使 用 指令 jr $310k 
转 到 新 创建 的 最 高 优先 级 的 任务 开始 执行 。 


2. 函数 BSP_Interrupt_HandIer 


如 图 15-13 所 示 ， 中 断 发 生 后 ， 会 调用 本 函数 进行 具体 的 中 断 处 
理 。 其 代码 如 下 。 





void BSP_Interrupt_Handler (void) 
{ 


INT32U cause_val; 
INT32U cause_reg; 


INT32U cause_ip; 


/* 读 取 Cause 寄 存 器 ， 获 得 其 中 的 ITP (Interrupt Pending) 字段 */ 


asm ("mfcO %0,$13" : "=r"(cause_val)); 
cause_reg = cause_val; 
cause_ip = cause_reg amp; 0x0000FF00 ; 


if((cause_ip amp; 0x00000400) != 0 ) 





{ 
/* 如 果 IP 字 段 表 示 是 时 钟 中 断 ， 那 么 调用 通 数 TickISR， 在 该 函数 中 将 
Compare 寄 存 器 增加 0x50009， 同 时 清除 时 钟 中 断 声 明 */ 
TickISR(0x50000) ; 
上 


上 述 代 码 首先 获取 Cause 寄 存 器 的 IP 字 段 ， 据 此 可 以 了 解 中 断 类 
型 ， 然 后 分 别 进行 处 理 。 此 处 只 对 时 钟 中 断 进 行 处 理 ， 读 者 朋友 可 以 自 
行 添加 对 其 余 中 断 的 处 理 代 码 。 如 果 是 时 钟 中 断 ， 那 么 会 调用 函数 
TickISR， 该 函数 在 文件 os_cpu_a.S 中 已 经 解释 ， 作 用 是 修改 Compare 寄 
存 器 的 值 ， 并 清除 时 钟 中 断 声 明 。 此 处 将 Compare 寄 存 器 的 值 增 加 
0x50000。 这 样 下 一 次 时 钟 中 断 就 会 在 0x50000 个 时 钟 周 期 后 再 次 发 生 ， 
如 果 系 统 的 运行 频率 是 277MHz， 那 么 0x50000 个 时 钟 周期 大 概 是 12ms。 
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进入 函数 ExceptionHandler 进 行 处 理 ， 后 者 会 调用 本 函数 处 理 各 种 具体 
异常 。 代 码 如 下 。 





OSIntCtxSw(); 


} 
} 

现在 ， 读 者 可 以 回顾 在 os_cpu.h 中 定义 的 一 个 宏 ， 如 下 。 
#define OS _TASK_SW() asm("\tsyscall\n"); 


如 上 所 示 的 宏 用 来 进行 任务 切换 ， 是 在 hC/OS-I 从 低 优先 级 任务 切 
换 到 高 优先 级 任务 时 使 用 到 的 。 它 是 如 何 实现 任务 切换 的 呢 ? 在 这 里 可 
以 找到 答案 。 





从 定义 中 可 以 发 现 该 宏 定义 实际 就 是 系统 调用 指令 syscall， 该 指令 
会 引起 系统 调用 异常 。 从 函数 BSP_Exception_Handler 的 代码 可 知 ， 系 统 
调用 异常 的 处 理 过 程 会 调用 函数 OSIntCtxSw。 函 数 OSIntCtxSw 在 文件 
os_cpu_a.S 中 实现 ， 上 一 小 节 已 给 出 解释 说 明 ， 其 作用 就 是 进行 任务 切 
换 。 由 此 ， 实 现 了 宏 OS_TASK_SW0O 的 功能 。 





对 于 无 效 指令 、 洲 出 寞 第 、 自 陷 异 党 等 寞 第 情 况 ， 并 没有 明确 如 何 
处 理 ， 读 者 可 以 依据 上 自己 的 需要 灵活 修改 ， 在 笔者 的 移植 过 程 中 ， 只 进 
行 任务 切换 。 








本 节 给 出 的 代码 位 于 本 书 附带 光盘 中 
Code\Chapter15\ucosii_OpenMIPS\port 目 录 下 的 同名 文件 。 


上 述 通过 对 os_cpuh、o0s_cpu_a.S、o0s_cpu_c.c 等 三 个 文件 的 修 
改 ， 实 现 了 移植 HC/OS-II 到 OpenMIPS 处 理 器 。 下 面 将 编写 测试 程序 
以 验证 pC/OS-II 是 否 移植 成 功 。 





15.12 测试 程序 


本 市 将 编写 一 个 简单 的 测试 程序 ， 在 该 程序 中 ， 我 们 创建 了 一 个 用 
户 任 务 ， 该 任务 通过 UART 输 出 一 个 指定 字符 串 中 的 一 个 字符 ， 同 时 通 
过 GPIO 输 出 一 个 数 《〈“ 初 始 的 时 候 为 0) ， 然 后 延 时 大 概 100ms， 再 输出 
虽 定 字符 串 中 的 下 一 个 字符 ， 同 时 将 GPIO 的 输出 加 2。 为 实现 该 测试 ， 
需要 创建 两 个 文件 openmips.h、openmips.c。 同 时 ， 修 改 include 文 件 夹 下 
的 文件 includes.h， 在 其 中 引用 新 创建 的 文件 openmips.h， 如 下 。 








#include <stdarg.h> 
#include <stddef.h> 
#include <limits.h> 


#include "ucos_ii.h" 





#include "openmips.h" // 增 加 对 openmips.h 文 件 的 引用 


15.12.1 创建 openmips.h 文 件 


openmips.h 文 件 定义 了 一 些 在 测试 程序 中 会 使 用 到 的 宏 定 义 ， 主 要 


内 容 如 下 。 源 文件 位 于 本 书 附 带 光 盘 中 
Code\Chapter15\ucosii_OpenMIPS\include 目 录 下 。 


ERRE SS Lk En A Gk KAX Ah Ed Ak ALR RS God Rak Ak A Gk Rak a Rad RAR Rak Sk Ed Sak Rad RAN KAS CAR RAL AR Bad Cad Rak EAN tad Gk Bak GE aD or Red GES ad Nad EG PE ee 


KKKKKKKKKKE 第 一 段 : 三 种 加 载 、 存储 炎炎 大 火炎 大火 类 大 


类 类 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 火炎 炎炎 炎炎 炎炎 炎炎 类 类 类 


#define REG8(addr) *((volatile INT8U *)(addr)) 
#define REG16(addr) *((volatile INT16U *)(addr)) 
#define REG32(addr) *((volatile INT32U *)(addr) ) 


he ERLE LEE RAE RTT Lk ALR Ed Gk KA RAN Ed ak Rak Ak KASE Gk Rak Ak BAT ak Rak Gk Ed Ak Rad Sk Rad Gk Sak Sk Bad Gk Bad Sak Sad Sak Sak Ek KASERAT Rad AN BAT Gad Ta GE GPRS EGS Os Sa GE GE RS ee 


KKKKKKKKKKE 第 二 段 : 系统 时 钟 KKKKKKKKKEK 


大 类 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 类 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 类 类 


#define IN CLK 27000000 /* 输入 时 钟 是 27MHz */ 


JERS ed ne NEE RARE ET EE LEE Sk RAE Ed Ek Sn KAS Ak Rak AR EA) Ek Rad Ak Bd Ak Bak A BA Ak BARE Bad EAR Bak AR Rd Ak Wak Ak KAS ER BAR EAR te CAE RAP GSP RE ES? RPE GE ERS ee 





KKKKKKKKKKE 第 三 段 : 与 UART 控 制 器 有关 的 宏 KKKKKKKKEKE 


火 大火 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 


#define UART_BAUD_RATE 9600 /* UART 速 率 是 9600bps */ 
#define UART_BASE 0x10000000 /* UART 控 制 器 的 起 始 地 址 */ 
#define UART_LC_REG 0x00000003 /* Line Control 寄 存 器 的 偏 移 地 ] 
#define UART_IE_REG 0x00000001 /* Interrupt Enable 寄 存 器 的 偏 
#define UART_TH_REG 0x00000000 /* Transmitter Holding# 74 


#define UART_LS_ REG 0x00000005 /* Line Status 寄 存 器 的 偏 移 地 址 


#define 


#define 


/* Line 
#define 


#define 


/* Line 
#define 
#define 


#define 


UART_DLB1_REG 0x00000000 
UART_DLB2_REG 0x00000001 


Status 寄 存 器 的 标志 位 */ 


/* 分 频 系数 低 字 节 的 偏 移 地 址 */ 
/* 分 频 系数 高 字 节 的 偏 移 地 址 */ 


UART_LS_TEMT 0x40 /* 第 6bit 为 发 送 数 据 空 标志  */ 


UART_LS_THRE 0x20 /* 第 5bit 为 发 送 FIFO 空 标志 */ 


Control 寄 存 器 的 标记 位 */ 

UART_LC_NO_PARITY 0x00 /* 
UART_LC_ONE_STOP 0x00 /* 
UART_LC_WLEN8 0x03 /* 


/* 一 些 函 数 声明 */ 


extern void uart_init(void); 


extern void uart_putc(char); 


extern void uart_print_str(char*); 





第 3bit 为 90， 表示 禁止 奇偶 校 验 */ 
第 2bit 为 909， 表示 1 位 停止 位 */ 
最 低 两 位 为 11， 表 示 数 据 长 度 是 8 位 */ 


JESS 
fre 


UART 控 制 器 初始 化 函数 */ 
UART 控 制 器 输出 字 节 函数 */ 
UART 控 制 器 输出 字符 串 函 数 */ 


VERS SETS ENE EINERSEITS TE TEE EAE EAS TE AE RI TE E A EAE CE BE Gd AD Gal Ga RE RE AS Gd ad Gal A TE ET ad Gal Gal Cl Ral Rad Ra Nad a Nad OWEN 


大 炎炎 炎炎 类 炎炎 火炎 类 


SUR: 与 6PI0 模 块 有 关 的 宏 eee ere 


火炎 火炎 火炎 大大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 


#define 
#define 
#define 
#define 


#define 


GPIO_BASE 0x20000000 
GPIO_IN_REG 0x00000000 
GPIO_OUT_REG 0x00000004 
GPIO_OE_REG 0x00000008 
GPIO_INTE_REG 0x0000000cC 


Hs 
” 
m 
ia 


GPIO 模 块 的 起 始 地 址 */ 

GPIO 模 块 输入 寄存 器 的 偏 移 地 址 */ 
GPIO 模 块 输出 寄存 器 的 偏 移 地 址 */ 
GPIO 模 块 输出 使 能 寄存 器 的 偏 移 地 址 
GPIO 模 块 中 断 使 能 寄存 器 的 偏 移 地 址 


/* 一 些 函 数 声明 */ 


extern void gpio_init(void); /* GPIO 模 块 初始 化 函数 */ 
extern void gpio_out(INT32U); /* GPIO 模 块 输出 函数 */ 
extern INT32U gpio_in(void); /* 读 取 6PIO 模 块 输入 的 函数 */ 


EEES 相信 RaP AS EAR BE GP Gl ak A SA BAR GE U EU ah OE Ga U EEE EEE EU yaa a? Rad A RO ada 


A 第 五 段 : 主 函 数 main 声 明 S E DE GS DE GE GE SS DS GS 


火炎 火炎 火炎 大大 大大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 


extern void main(void); 


上 述 代 码 可 以 分 为 五 段 理 解 。 


第 一 段 : 定义 了 三 种 加 载 、 存 储 的 宏 ， 分 别 是 : FH AR Fo 
通过 如 下 实例 说 明 其 用 法 。 


result = REG8(addr); // 加 载 地 址 addr 处 的 字 节 

result = REG16(addr);  // 加 载 地 址 addr 处 的 半 字 

result = REG32(addr);  ”// 加 载 地 址 addr 处 的 字 
REG8(addr) = OxFF; // 将 字 节 0XxFF 存 储 到 地 址 addr 处 
REG16(addr) = OxFFFF; // 将 半 字 90xFFFF 存 储 到 地 址 addr 处 


REG32(addr) = 9xFFFFFFFF， // 将 字 0xFFFFFFFF 存 储 到 地 址 addr 处 


第 二 段 ， 定义 了 系统 时 钟 ， 我 们 的 最 小 SOPC 运 行 在 DE2 平 台 上 ， 
使 用 的 是 27MHz 的 时 钟 ， 所 以 此 处 设置 为 27000000。 


第 三 段 ， 定义 了 与 UART 控 制 旧 有关 的 宏 ， 包 括 : UART 控 制 器 的 
起 始 地 址 ， 因 为 在 小 型 SOPC 中 ，UART 控 制 器 挂 在 WB_CONMAX 的 从 


设备 接口 1， 所 以 其 地 址 空间 从 0x10000000 开 始 ; 还 定义 了 UART 控 制 
器 中 各 个 寄存 器 的 地 址 相对 起 始 地 址 的 偏 移 ， 还 定义 了 UART 控 制 器 的 
传输 速率 ， 此 处 设置 为 9600bps。 另 外 ， 还 有 一 些 标志 位 ， 读 者 可 以 参 
考 13.4.2 节 理解 ， 在 文件 openmips.c 使 用 这 些 标志 位 的 时 候 会 更 加 清楚 其 





第 四 段 : 定义 了 与 GPIO 模 块 有 关 的 宏 ， 包 括 : GPIO 模 块 的 起 始 地 
址 ， 因 为 在 小 型 SOPC 中 ，GPIO 模 块 挂 在 WB_CONMAX 的 从 设备 接口 
2， 所 以 其 地 址 空间 从 0x20000000 开 始 ; 还 定义 了 GPIO 模 块 中 各 个 寄存 
器 的 地 址 相对 起 始 地 址 的 偏 移 。 


BiB: 主 函 数 main 声 明 。 


15.12.2 4! #openmips.c X 44 


openmips.c 文 件 实现 了 用 户 任务 ， 该 任务 通过 UART 输 出 一 个 指定 
字符 串 中 的 一 个 字符 ， 同 时 通过 GPIO 输 出 一 个 数 〈 初 始 的 时 候 为 0) ， 
然后 延 时 大 概 100ms， 再 输出 指定 字符 串 中 的 下 一 个 字符 ， 同 时 将 GPIO 
的 输出 加 2。 主 要 代码 如 下 ， 源 文件 位 于 本 书 附带 光盘 中 
Code\Chapter15\ucosii_OpenMIPS\common H 3 Fo 


Gf BREESE SESE SS o Ed EAEKO a SB EAE AE AL OS OLD O EAL AE GALS SAL RAP GAL E EAL EAL RAP ELE E ad SOC ad Nad RS Nad ad a as Nad ad ade 


KKKKKKKKKKE er = bar gn y 炎炎 大 火炎 类 火炎 类 类 
mer ie 


火 大 大大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 


#include "includes.h" 
















































































ucosii_OpenMIPS 


Makefile 
config.mk 
ramld 
BootLoader.bin 
BinMerge.exe 


| ucos | 包含 hc/OS-TT 源 代码 的 大 部 分 文件 


0S_core.c 
os_dbg_r.c 
os_flag.c 
os_mbox.c 
os_mem.c 
0S_mutex.c 
os_q.c 
0S_sem.c 
os_task.c 
os_time.c 
os_tmr.c 
ucos_ii.c 
Makefile 


包含 与 具体 处 理 器 有 关 的 源 代码 文人 


os_cpu_a.S 
os_cpu_c.c 
Makefile 


incide] arsch 
app_cfg.h 
cpu.h 
includes.h 
os_cfg.h 
os_cpu.h 
ucos_ii.h 
Makefile 
openmips.h 


aan 


openmips.c 





15.14 0penMIPS 处 理 器 运行 移植 后 的 u( 


按照 第 14 章 介绍 的 步 又 将 文件 0S .bin 写 入 DE2 开 发 平台 上 的 Flash， 打 开 PC 上 的 串 | 








读者 注意 一 点 ， 图 中 显示 的 字符 格式 与 预期 的 并 不 一 样 ， 有 些 地 方 没有 换行 ， 这 与 串 


FEARRDE (CEA V3. 1) 





通讯 设置 

串口 号 |COM1 v 
波 特 率 |9600 v 
校 验 位 [NONE y 
数据 位 | Siz 了 | 
停止 位 | 位 +) 


接收 区 设置 

厂 接收 转向 交 件 ... 
厂 自动 换行 显示 
厂 十 六 进 制 显示 
三 暂停 接收 显示 
发 送 区 设置 

厂 启用 文件 数据 源 ... 
三 自动 发 送 附 加 位 
厂 发 送 完 自动 清空 
三 按 十 六 进 制 发 送 
厂 数据 流 循环 发 送 


ARRE GP 


Loading 05 into SDRAM... 
“LLoad OS into SDRAM DONE!!! 
UART initialize done ! 

GPIO initialize done | 
上 帝 说 要 有 光 ， 于 是 就 有 了 光 


上 帝 说 要 有 天 空 ， 于 是 就 有 了 天 空 上 帝 说 要 有 陆地 和 海洋 ， 于 是 就 有 了 陆地 和 
海洋 


发 送 间 隔 |1000 毫秒 mex | | 


LE 按 CtrltEnter 发 送 





发 送 | 595 #5207 ”复位 计数 | 


附录 A 教学 版 0penMIPS 各 个 模块 
的 接口 说 明 


Al PC 模块 接口 说 明 


PC 模块 接口 如 图 A-1 所 示 ， 采 用 左边 是 输入 接口 ， 石 边 是 输出 接口 
的 方式 绘制 ， 目 的 是 便于 理解 ， 附 录 A 中 其 余 模 块 的 接口 图 也 都 是 采用 
这 种 方法 绘制 ， 后 面 不 再 重复 说 明 。 各 接口 的 描述 如 表 A-1 所 示 。 


PC 





stall 

flush 

new_pc 
branch flag i 


branch target address 1 


rst 


clk 








pc_reg.v 
图 A-1 PC 模块 的 外 部 接口 


表 A-1 PC 模块 的 接口 描述 


输入 /输出 
个 入 











是 在 发 生 转 科 


转移 到 的 目标 地 址 








流水 线 清除 信号 
异常 处 理 例 程 入 口 地 址 
取 指 地 址 
的 指令 地 址 

指令 存储 器 ROM 使 能 信号 





























A.2 IEF/ID 模 块 接口 说 明 


IFMID 模 块 接口 如 图 A-2 所 示 ， 各 接口 的 摘 述 如 表 A-2 所 示 。 


表 A-2 1F/1D 模 块 的 接口 描述 





区 出 的 指令 对 应 的 地 址 
价 段 取出 的 指令 


UN ELL ELAS tp 
re TF IS 


价 段 的 指令 对 应 的 地 址 
































AB ID 模块 接口 说 明 


ID 模块 接口 如 图 A-3 所 示 ， 各 接口 的 描述 如 表 A-3 所 示 。 


























ID 
pe_i aluop_o 
inst_i alusel_o 
ex_aluop i regl_o 
ex_wreg 1 reg2_0 
ex_wd i wd_o 
ex wdata 1 wreg_ 0 
mem wd i excepttype_o 
mem_wreg i inst_o 
mem wdata 1i current_inst_address_o 
IF/ID is_in_delayslot_o 
= link_addr o 
ifpe id pe next_inst_in_delayslot_o 
MER E is in delayslot i regl_read_o 
= regl_addr_o 
if id.v reg2_read_o 
rst reg2 addr 0 
stallreq 
regl_data_i branch_flag_o 
reg2 data_i branch_target_address_o 

id.v 


图 A-2 ”1F/1D 模 块 的 外 部 接口 图 A-3 ”1D 模块 的 外 部 接口 


表 A-3 1D 模 块 的 接口 描述 


CAC E AC 
(bit) | 输出 

CC ET | 
— a CS 洋 码 阶段 的 指令 对 应 的 地 址 
从 Regfile 笨 入 的 第 一 个 读 寄存 器 闭口 的 输入 
从 Regfile 输入 的 第 二 个 谈 寄 存 器 端口 的 输入 
6e [ewei |i [mA | 处 于 执行 除 段 的 指令 是 否 要 写 目 的 寄存 器 
处 于 执行 阶段 的 指令 要 写 的 目的 寄存 器 地 址 
so [ewaaai Jaz | 输入 | 处 于 执行 阶段 的 指令 要 写 入 目的 寄存 器 的 数据 
9 [memwregi |1 | 输入 | 处 于 访 存 阶段 的 指令 是 否 要 写 日 的 寄存 器 
ao |mmwai | | 输入 | 处 于 访 存 阶段 的 指令 要 写 的 目的 寄存 器 地 址 
[emdara i |32 | 输入 | 处 于 沪 存 阶段 的 指令 要 写 入 目的 寄存 器 的 数据 
E EXA |s [ma | 处 于 执行 阶段 指令 的 运算 于 类 型 
13 [is imdelaystori Jia | 和 输入 | Pitre POESIA NOSE ALA TACA 
a ja i 输出 。 | Regfite 模块 的 第 一 个 读 寄 存 器 端口 的 读 使 能 信和 号 
15 [eg2_reado Ji | 输出 |Regfile 机 天 的 第 二 个 读 寄 存 器 端口 的 读 使 能 信号 
Regfile 模 决 的 第 一 个 读 寄 存 器 端口 的 读 地 址 信号 
17 | reg2 adds o | [Hätte | Reptile 模块 的 第 二 个 读 寄存 器 端口 的 读 地 址 信号 
jis fatuopo = (sti Ss eh | 泽 码 险 眉 的 指令 要 进行 的 运算 的 子 类 型 
译 代 阶段 的 指令 要 进行 的 运算 的 类 型 
20 resto |2 | 输 册 | 译 码 阶段 的 指令 妆 进 行 的 运算 的 源 操 作 数 1 
泽 码 阶段 的 指令 要 进行 的 运算 的 源 操作 数 2 
2 — [wo | Ja) 详 码 阶段 的 指令 要 写 入 的 目的 寄存 器 地 址 
3 |weo |a Janm | 译 友 阶段 的 指令 是 否 有 娄 写 入 的 目的 寄存 器 
E rr CET 
|25 | branch target address o | 32 | 输出 | 转移 到 的 目标 地 志 
26 | is imdelaysioro [1 Jans | 当前 处 于 译 码 阶段 的 指令 是 于 位 于 延 巡 楼 
转移 指令 要 保存 的 返回 地 址 
28 | next inst in delaystot_o [1 [Ah | 下 一 条 进入 评 码 阶段 的 指令 是 下 位 于 延迟 本 
e pe | 当前 处 于 详 公 阶段 的 指令 
COM Jesse je ar il | 收集 的 异常 信息 
泽 码 阶段 指令 的 地 吉 
e ea h E] 洋 码 阶段 请 求 流水 暂停 





AA ”Regfile 模 块 接口 说 明 


Regfile 模 块 接口 如 图 A-4 所 示 ， 各 接口 的 摘 述 如 表 A-4 所 示 。 


表 A-4 Regfile 模 块 的 接口 描述 


ee EEE E bit) A es ee 


复位 信号 ， 高 电 平 有 效 
clk 时 钟 信号 
Par mr 2 要 写 入 的 寄存 器 地 址 
CC i 要 写 入 的 数据 
I kl Sb As a 





Pi IE EY AA bh: 
读 寄存 器 端口 读 使 能 信号 
读 寄 存 器 端口 输出 的 寄存 器 值 
读 寄 存 器 端口 要 读 取 的 寄存 器 的 地 址 


sata 
ars 





























~A 
5 二 个 读 寄 存 器 端口 输出 的 寄存 器 值 








A.5 ID 和 EX 模块 接口 说 明 


ID/EX 模 块 接口 如 图 A-5 所 示 ， 各 接口 的 描述 如 表 A-5 所 示 。 


Regfile 





rel 


raddrl 

re2 

raddr2 rdatal 
waddr rdata2 











regfile.v 


图 A-4 Regfile 模 块 的 外 部 接口 


表 A-5 








ID/EX 
stall ex_aluop 
flush ex_alusel 
id_aluop ex_regl 
id_alusel ex_reg? 
id regl ex_ wd 
id_reg2 ex_wreg 
id_wd ex_excepttype 
id_wreg ex_link_address 


id_excepttype 

id_inst 
id_current_inst_address 
id_is_in_delayslot 
id_link_address 


next_inst_in_delayslot_i 


rst 


clk 


ex_inst 


ex_is_in_delayslot 


ex_current_inst_address 


is in delayslot_o 





id_ex.v 


图 A-5 ”1D/EX 模 块 的 外 部 接口 


1D/EX 模 块 的 接口 描述 





le TT 
人 ae EC CN 


| 
CON IC 
w fum fa E 
o — Jas Tm Jen | 


ex_link address 





译 公 阶段 的 指令 要 进行 的 运算 的 类 型 

译 但 阶段 的 指令 要 进行 的 运算 的 子 类 型 

译 码 阶段 的 指令 要 进行 的 运算 的 源 操 作 数 1 

译 码 阶段 的 指令 要 进行 的 运算 的 源 操作 数 2 

详 码 阶段 的 指令 要 写 入 的 目的 寄存 器 地 扯 

译 人 码 阶段 的 指令 是 否 有 要 写 入 的 目的 寄存 器 

FRA 

流水 线 清除 信号 

译 码 阶段 收集 到 的 异常 信息 

译 码 阶段 指令 的 地 址 

当前 处 于 译 码 阶段 的 指令 基 否 位 于 延 颂 档 

处 于 译 码 阶 段 的 转移 指令 要 保存 的 返回 地 志 

下 一 条 进入 译 码 阶段 的 指令 是 否 位 于 延 送 模 
当前 处 于 详 码 阶段 的 指令 

当前 处 于 执行 阶段 的 指令 

当前 处 于 执行 阶段 的 指令 是 否 位 于 延迟 梢 

处 于 执行 阶段 的 转移 指令 要 保存 的 返回 地 址 











is in delayslot_o 


E PST E CT 


"NE F PROT RAST 4 AE Pe SES AY 
译 码 阶段 收集 到 的 异常 信息 

执行 阶段 的 指令 要 进行 的 运算 的 类 型 

执行 阶段 的 指令 概 进 行 的 运算 的 子 类 型 
执行 阶段 的 指令 要 进行 的 运算 的 源 操作 数 1 
执行 阶段 的 指令 要 进行 的 运算 的 源 操作 数 2 
执行 阶段 的 指令 要 写 入 的 目的 寄存 器 地 址 
执行 阶段 的 指令 是 否 有 要 写 入 的 目的 寄存 器 











A.6 EX 模块 接口 说 明 


EX 模块 接口 如 图 A-6 所 示 ， 各 接口 的 描述 如 表 A-6 所 示 。 


EX 








aluop_i 

alusel i 

regl_i 

reg2 1 

wd_i 

wreg_i 
excepttype_i 

link address_i 
inst_i 
is_in_delayslot_i 


current_inst_address_i 


cpO_reg data_i 
wb hi i 

wb lo i 

wb whilo i 
wb_cpO_reg we 
wb_cpO_reg write _addr 
wb_cpO_reg data 
mem_hi_i 
mem lo i 
mem_whilo_i 
mem_cpO_reg we 


mem_cpO_reg write _addr 





mem_cpO_reg data 
hilo_temp_i 

cnt i 

div_result_i 
div_ready_i 


rst 


cpO_ reg we_o 
cpO_reg write_addr_o 
cpO_reg data_o 


mem_addr_o 


reg2 o 

hi o 

lo_o 

whilo_o 

hilo temp_o 
ent_o 
excepttype_o 
is_in_delayslot_o 
current_inst_address_o 
aluop_o 

wreg oO 

wd_o 


wdata_o 


stallreq 


cpO_reg read_addr_o 


signed div_o 
div_opdatal_o 
div_opdata2_o 


div_start_o 





exv 


图 A-6 EX 模块 的 外 部 接口 


表 A-6 EX 模块 的 接口 描述 


执行 阶段 要 进行 的 运算 的 类 型 
执行 阶段 要 进行 的 运算 的 子 类 型 


参与 运算 的 源 操作 数 1 








q 


— — o JJ | o un 
心 | 个 p te 


Jo 


reg2 i 


a 


wreg i 


excepttype i 


current_inst_addr i 


wo 


is_in delayslot 1 
link_address 1 


hilo temp i 


oe 


hilo_temp_o 


in 


ent_o 


excepttype_o 


current inst addr_o 


is in delayslot_o 


一 
wo 


wd o 


wreg 0 输 
N} 


5 
32 


wdata_o 
signed div_o 
div_opdatal_o 


as 


div opdata2 o 
div start o 
div_result_i 


div_ready_1 


er 


= 


mem whilo i 


mem hi i 


wb whilo i 


las 
> 


4 4 ta wu t t te N N bo N N N [S] 
tn - N — S wo Re “N n de ‘ N © 


wb hi i 


g Z 
= a 
joS 155 


er 


wb lo 1 


dt 


出 
An 


NE F JE 
32 被 除数 


es 


执行 阶段 指令 的 地 址 
当前 处 于 执行 阶段 的 


A, 


iia eae eS 


第 一 个 执行 周期 得 到 的 乘法 结果 


第 一 个 执行 周期 得 到 的 乘法 结 华 
FF 一 个 时 钟 周期 处 于 执行 阶段 的 第 儿 个 时 
钟 周 期 
详 码 阶段 、 执 行 阶段 收集 到 的 异常 信息 
执行 险 段 的 指令 是 否 是 延迟 梢 指令 


执行 阶段 的 指令 最 终 要 写 入 的 目的 寄存 如 


及 


u 
er 


uy bit BX VR REA AT ES A IN 


Wer 


u 
ae 


tt 


H 除数 


Zr 
zu 


HILO 模块 给 出 的 HI 寄存 器 的 值 

HILO 模块 给 出 的 LO 寄存 器 的 值 

处 于 访 存 阶段 的 指令 是 否 要 写 HI. LO 寄存 4 
处 于 访 存 阶 段 的 指令 要 写 入 HI 寄存 器 的 值 
处 于 访 存 阶段 的 指令 要 写 入 LO 寄存 器 的 值 
处 于 加 写 阶段 的 指令 是 否 要 写 HL LO 寄存 器 
处 于 回 写 阶 段 的 指令 要 写 入 HI 寄存 器 的 值 
处 于 回 写 阶段 的 指令 要 写 入 LO 寄存 器 的 值 


ET, 


u 
hr 


yu 
A 


yu 
做 





入 / 
EA 
| whiloo | o 四 执行 阶段 的 指令 是 否 要 写 HL, LO Ale 
A A 执行 阶段 的 指令 要 写 入 HI 寄存 器 的 值 
a pe E (m 执行 阶段 的 指令 要 写 入 LO 寄存 器 的 值 
cp0 reg data i 输入 从 CPO 模块 读 取 的 指定 寄存 器 的 值 
mem _cp0_reg we 输入 访 存 阶段 的 指令 是 否 要 写 CP0 中 的 寄存 器 


访 存 阶 段 的 指令 要 写 入 CPO TERMIN 
wb cp0 reg we Cs 回 写 阶段 的 指令 是 否 要 写 CPO 中 的 寄存 器 


wb_cp0_reg_write_addr Is [输入 | 回 写 阶段 的 指令 要 写 的 CPO 中 寄存 器 的 地 址 





E wb_cp0_reg data PR 回 写 阶段 的 指令 要 写 入 CP0 中 寄存 器 的 数据 


执行 阶段 的 指令 要 读 取 的 CP0 中 寄存 器 的 
地 址 

执行 阶段 的 指令 是 否 要 写 CPO 中 的 寄存 器 

执行 阶段 的 指令 要 写 的 CPO 中 寄存 器 的 地 址 

执行 阶段 的 指令 要 写 入 CPO 中 寄存 器 的 数据 

当前 处 于 执行 阶段 的 指令 

执行 阶段 的 指令 要 进行 的 运算 的 子 类 型 
输出 加 载 、 存 储 指 令 对 应 的 存储 器 地 址 

存储 指令 要 存储 的 数据 , 或 者 Iwl、 Iwr 指令 
要 写 入 的 目的 寄存 器 的 原始 值 
输出 执行 阶段 是 否 请 求 流水 线 暂 停 


cp0 reg read addr_o 


Pm hte 
ee ea 
区 


ES 


aluop_o 
mem addr o 


ap | ap 
=> | => = 
> =? 





A.7 DIV 模块 接口 说 明 


DIV 模块 接口 如 图 A-7 所 示 ， 各 接口 的 描述 如 表 A-7 所 示 。 
DIV 







annul 1 
signed div i result_o 
opdatal 1 ready 0 


opdata2_i 





start 1 


div.v 


图 A-7 DIV 模块 的 外 部 接口 


表 A-7 DIV 模块 的 接口 描述 


A PEA EEE DE En 
SLA MATER 

aa A iu 
被 除数 


signed div i 





opdatal i 





:运算 ， 为 1 表示 取消 除法 运算 


annul i 


result_o 














3 1 - 

4 " 

5 opdata2 i 除数 

Fre start 1 是 否 开始 除法 运算 
ja | u I E 


A.B EX/MEM 模 块 接口 说 明 


EX/MEM 模 块 接口 如 图 A-8 所 示 ， 各 接口 的 描述 如 表 A-8 所 示 。 





stall 

flush 

ex_cp0 reg we 
ex_cp() reg write addr 
ex_cp0 reg data 


ex_mem_addr 


ex_reg2 

ex hi 

ex_lo 

ex_whilo 

hilo_i 

ent i 
ex_excepttype 
ex_is in delayslot 
ex current inst address 
ex_aluop 

ex wreg 

ex_wd 

ex_wdata 


rst 


clk 


EX/MEM 


mem wd 
mem_wreg 
mem wdata 
mem hi 
mem _lo 
mem_whilo 
mem_aluop 


mem_mem_addr 


mem_reg? 
mem cpû reg we 
mem_cp0_reg_write_addr 
mem_cp0_reg_ data 
mem_excepttype 
mem_is_in_delayslot 

mem current inst address 
hilo_o 


cnt O 


ex_mem.v 





图 A-8 EX/MEM 模 块 的 外 部 接口 


表 A-8 EX/MEM 模 块 的 接口 描述 


bs 1 HER AA ESA E IAE 
5 rn m 执行 阶段 的 指令 执行 后 要 写 入 目的 寄存器 的 值 
[memwa |s [iam | 访 在 阶段 的 指令 要 写 入 的 目的 寄存 器 地 直 
[mem wreg ao | 访 存 阶段 的 指令 是 否 有 要 写 入 的 目的 寄 在 器 
| 沪 在 阶段 的 指令 要 写 入 目的 寄存 器 的 值 
soo fsa f a| EC 
pio fon ||! Tann | 是否 消除 流水 线 
u fexcpOregwe [1 A | 执行 阶 段 的 指令 是 大 要 写 CP0 中 的 寄存 器 
J12 [ex cp0 reg write addr |s | 给 入 | 执行 险 段 的 指令 要 写 的 CP0 中 寄存 器 的 地 址 
执行 阶段 的 指令 要 写 入 CPO 中 寄 在 器 的 数据 
i4 |memepo regwe |1 [gi | 访 存 阶段 的 指令 是 否 要 写 CPO 中 的 咨 存 器 
jis | mem ep0 reg write addr |5 [an | 访 存 阶段 的 指令 要 写 的 CP0 中 寄存 咒 的 地 直 
116 | mem cp0 reg data |32 | 输出 | 访 存 阶段 的 指令 要 写 入 CPO 中 寄存 器 的 数据 
17 Ar A | 执行 阶段 的 指令 要 进行 的 运算 的 子 类 型 
e 输入 | 执行 阶段 的 加 载 ， 存 储 指令 对 应 的 存储 器 地 所 


i> 执行 阶段 的 存储 指令 要 存储 的 数据 , 或 者 Iwl、 lwr 
EX \ 
u ‘ 指令 要 写 入 的 目的 4 a nu = 


a Neil Maree O 


Us AT RN RA O MEE RT AN BR BF wl Iwr 
is 指令 要 写 入 的 目的 寄存 器 的 原始 值 
swhie [1 aA | 执行 阶段 的 指令 是 吾 要 写 HI, LO 寄存 器 
执行 阶段 的 指令 要 写 入 HI 寄存 器 的 全 
执行 阶段 的 指令 要 写 入 LO 寄存 器 的 什 
126 [memowhilo a | 访 在 阶段 的 指令 是 否 要 写 HI、LO 寄存 器 
E mem hi |32 | 输出 | 访 在 阶段 的 指令 要 写 入 HI 寄存 器 的 值 
s [memto [32 | 输出 | 访 存 阶 段 的 指令 要 写 入 LO tetet 
z ae J 输入 | 译 码 、 执 行 阶段 收集 到 的 异常 信息 

lex current inst address [32 | 输入 | 执行 阶段 指令 的 地 志 
a EST I er 执行 阶段 的 指令 是 否 是 延迟 档 指 令 
输出 | 译 码 、 执 行 阶段 收集 到 的 异常 信息 


a 
— 执行 阶段 的 指令 执 行 后 要 写 入 的 目的 寄存 器 地 址 
a lex 
s lex 
s | 
z | 





接口 名 





mem current inst address | 3 A 访 存 阶 段 指令 的 地 址 


mem is in delayslot tl 访 存 阶段 的 指令 是 否 是 


hilo i 
cnt i 下 一 个 时 钟 周 期 是 执行 阶段 的 第 几 个 时 钟 周 期 
hilo o antl 保存 的 乘法 结果 

cnt o a 当前 处 于 执行 阶段 的 第 几 个 时 钟 周 期 























A.9 MEM 模 块 接口 说 明 


MEM 模 块 接口 如 图 A-9 所 示 ， 各 接口 的 描述 如 表 A-9 所 示 。 





whilo_i 
aluop_i 


mem_addr_i 


reg2 i 

cp0_reg we 1 

cp0_reg write addr i 
cpO_reg_data_i 
excepttype_i 
is_in_delayslot_i 
current_inst_address_i 
LLbit_i 

cpÖ_status_i 
cpO_cause_i 
cp0_epc_i 
wb_LLbit_we_i 
wb_LLbit_value_i 
wb_cp0_reg_we 
wb_cp0_reg_write_addr 
wb_cp0_reg data 
mem_data_i 


rst 


MEM 


cp0_epc_o 
LLbit_value_o 
LLbit_we_o 
wd_o 

wreg_o 


wdata_o 


whilo_o 
cp0_reg_we_o 
cp0_reg_write_addr_o 


cpO_reg _data_o 


excepttype_o 


current_inst_address_o 


is_in_delayslot_o 


mem_we_o 
mem_addr_o 
mem_sel_o 


mem_data_o 


mem_ce_o 


mem.v 





图 A-9 MEM 模块 的 外 部 接口 


表 A-9 MEM 模块 的 接口 描述 


| 
(bit) | 输出 

| | 

2 |wai ss | 输入 | 访 在 阶段 的 指令 要 写 入 的 目的 寄存 吕 地 志 

a wreeit J1 sd A 访 存 阶段 的 指令 是 否 有 要 写 入 的 日 的 寄存 器 

访 存 阶段 的 指令 要 写 入 目的 寄存 器 的 什 

沪 存 阶 段 的 指令 最 终 要 写 入 的 目的 寄存 器 地 志 

6 [wrego [1 [am | 访 存 阶 段 的 指令 最终 是 再 有 要 写 入 的 月 的 坎 在 器 

输出 |。 访 存 阶段 的 指令 最 终 机 写 入 目的 寄存 器 的 值 

一 一 访 存 阶段 的 指令 要 进行 的 运算 的 子 类 型 

9 [memaddri | 32 访 存 阶段 的 加载 、 在 储 指令 对 应 的 存储 生地 氟 


jo fs e Yat | 访 在 阶段 的 存储 指令 要 存储 的 数据 ,或 者 Iwl, Iwr 
生 令 要 写 入 的 目的 寄存 器 的 原始 个 
ea fa 从 致 据 在 储 器 该 地 的 数据 
memaddro 32s ath | 要 访问 的 数据 存储 器 的 地 址 
re fan KERN. W1 表示 是 写 操 人 
[mem selo fa pam |S mamis 
[mem dao 0 [s2 [øn | 要 写 入 数据 存储 器 的 监 据 
emeeoe [i |[ 输 由 | 数据 存储 将 使 能 信号 
ee ee 访 存 阶段 的 指令 是 否 要 写 HI, LO RIER 
as [nii [az | 输入 | 访 在 阶段 的 指令 要 写 入 二 寄存 器 的 值 
9 CC ENTE 
2 [whiloo DE [im] 访 存 阶 段 的 指令 最 终 是 否 要 写 AI, LO 寄存 如 
沪 存 阶段 的 指令 最 终 要 写 入 HI 寄存 器 的 值 
2 loo [32 CI | 访 丰 阶 段 的 指令 最 终 要 写 入 LO 寄存 器 的 侦 
I23 leporegwei | | 输入 | 访 存 阶 段 的 指令 是 省 要 写 CPO 中 的 寄存 器 
MA | 访 存 阶段 的 指令 要 写 的 CP0 中 寄存 器 的 地 址 
输入 “| 访 存 阶段 的 指令 妆 写 入 CPO 中 寄存 器 的 数据 
26 [epo reg weo |1 | 输出 | 访 存 阶段 的 指令 最 终 巧 否 强 写 CPO 中 的 寄存 器 
访 存 阶 段 的 指令 最 终 要 写 的 CP0 中 寄存 器 的 地 址 
访 存 阶 段 的 指令 最 终 娄 写 入 CPO 中 寄存 器 的 数据 
译 码 、 执 行 阶段 收集 到 的 异常 信息 
访 存 阶 段 指 邻 的 地 直 
31 lis in delaysiot i |i [mA | 访 存 阶 段 的 指令 是 否 是 延迟 机 指令 
apresi E p CPO 中 Status 寄存 器 的 值 
33 |epo cause i |32 | 输入 | CPO A Cause 寄存 器 的 值 





current_inst_address_o 


fF 用 


CPO 中 EPC 寄存 器 的 值 


回 写 阶 段 的 指令 是 否 要 写 CPO 中 的 寄存 


回 写 阶 段 的 指令 要 写 的 CP0 中 寄存 器 的 地 址 


ar 


回 写 阶段 的 指令 要 写 入 CPO 中 寄存 器 的 值 


最 终 的 异常 类 型 


访 存 阶段 指令 的 地 址 





is in delayslot_o 


wb LLbit we i 





访 存 阶段 的 指令 是 否 是 延迟 档 指 令 
CP0 中 EPC 寄存 器 的 最 新 值 
LLbit 模块 给 出 的 LLbit 寄存 器 的 值 


回 写 阶 段 的 指令 是 否 要 写 LLbit 寄存 器 


u 
ir 





wb LLbit value i 


LLbit_we_o 


回 写 阶 段 要 写 入 LLbit 寄存 器 的 值 


访 存 阶段 的 指令 是 否 要 写 LLbit 寄存 器 


117 
ir 





LLbit_value_o 











访 存 阶段 的 指令 要 写 入 LLbit 寄存 器 





的 值 


A.10 MEMVWB 模 块 接口 说 明 


MEMVWB 模 块 接口 如 图 A-10 所 示 ， 各 接口 的 描述 如 表 A-10 所 示 。 


MEM/WB 
stall wb_whilo 
flush wb_hi 
mem_LLbit_value wb lo 
mem_LLbit_we wb_LLbit_we 
mem wd wb_LLbit_value 
mem_wreg 
mem wdata wb_wd 
mem hi wb_wreg 
mem_lo wb_wdata 
mem_whilo wb_cp0_reg we 
mem_cp0_reg_we wb cpO reg write addr 
mem cp0 reg write addr wb_cp0 reg data 
mem cp0 reg data 
rst 
clk 








mem wb.v 


图 A-10 ”MEMAWB 模 块 的 外 部 接口 


表 A-10 ”MME/WB 模 块 的 接口 描述 


复位 信号 
时 钟 信号 


入 访 存 阶段 的 指令 最 终 要 写 入 的 日 的 寄存 器 
ie 地 址 
e 访 存 阶段 的 指令 最 终 蚌 否 有 要 写 入 的 上 日 的 寄 
HA 
(54 


访 存 阶段 的 指令 最 终 要 写 入 目的 寄存 器 的 值 
ETE 回 写 阶段 的 指令 要 写 入 的 目的 寄存 器 地 址 
下 一 st 回 写 阶 段 的 指令 是 奉 有 归 写 入 的 目的 寄存 器 
CE O fa ja i 回 写 阶段 的 指令 要 写 入 目的 寄存 器 的 值 

沪 存 阶段 的 指令 是 否 要 写 LLbit 寄存 器 

访 存 阶段 的 指令 要 写 入 LLbit 寄存 器 的 什 

回 写 阶段 的 指令 是 否 要 写 LLbit 寄存 器 


wb_LLbit value j 回 写 阶段 的 指令 要 写 入 LLbit 寄存 器 的 值 











mem_cp0_reg we i 访 存 阶段 的 指令 是 否 要 写 CPO 中 的 寄存 器 


沪 存 阶段 的 指令 要 写 的 CP0 中 寄存 器 的 地 址 

沪 存 阶段 的 指 冬 要 写 入 CP0 中 寄存 器 的 数据 
aa aS 
> 输 ! 回 写 阶段 的 指令 要 写 的 CP0 中 寄存 器 的 地 寺 
ls wesporgaaa |32 |w 回 写 阶段 的 指令 要 写 入 CP0 中 寄 在 器 的 数据 
o fe | Era, LO 508 
20 mem |32 |ñ 访 存 阶段 的 指令 要 写 入 HI 寄存 器 的 值 
= jes |a E 访 存 阶 段 的 指令 要 写 入 LO ar fF ee 
2 fom [i fe au | ram ISAS H LO WIR 

wb_hi 回 写 阶段 的 指令 要 写 入 HI 寄存 器 的 值 
回 写 阶段 的 指令 要 写 入 LO 寄存 器 的 值 
) 访 存 阶段 是 否 和 暂停 


26 flush ) 是 否 清除 流水 线 














A.11 CP0 模 块 接口 说 明 


CP0 模 块 接 口 如 图 A-11 所 示 ， 各 接口 的 接 述 如 表 A-11 所 示 。 








CP0 

we_i data_o 
waddr i count o 
data i compare_o 
excepttype_i status 0 
int 1 cause 0 
current inst addr i epc 0 
is in delayslot i config_o 
raddr_i prid_o 
rst 

clk timer_int_o 





cp0_reg.v 
图 A-11 ”CPO 模块 的 外 部 接口 


表 A-11 CP0 模 块 的 接口 描述 


时 钟 信号 

输入 | 要 读 取 的 CPO 中 寄存 器 的 地 址 
是 否 要 写 CPO 中 的 寄存 器 

输入 | 要 写 的 CP0 中 寄存 器 的 地 址 

BES CPO 中 寄存 器 的 数据 

输出 “| 读 出 的 CPO 中 某 个 寄存 器 的 值 


mil Count 寄存 器 的 值 


Compare 寄存 器 的 值 


Status 寄存 器 的 值 
Cause 寄存 器 的 值 
EPC 寄存 器 的 值 





Config 寄存 口 的 值 

DAN PRId 寄存 器 的 值 

全 出 | 是 否 有 定时 中 断 发 生 
seme E mA | 最 终 的 异常 类 型 

发 生 异常 的 指令 地 址 

mA | 发 生 异 常 的 指令 是 否 是 延迟 模 指 令 














A.12 LLbit 模 块 接口 说 明 


LLbit 模 块 接口 如 图 A-12 所 示 ， 各 接口 的 描述 如 表 A-12 所 示 。 
LLbit 


we 


LLbit_1 LLbit_o 


flush 





LLbit_reg.v 


图 A-12 ”LLbit 模 块 的 外 部 接口 


表 A-12 LLbit 模 块 的 接口 描述 


























A.13 HILO 模 块 接口 说 明 


HILO 模 块 接口 如 图 A-13 所 示 ， 各 接口 的 描述 如 表 A-13 所 示 。 


HILO 





hilo_reg.v 


图 A-13 ”HILO 模块 的 外 部 接口 
表 A-13 ”HILO 模块 的 接口 描述 





HI, LO $ A an 3 使 能 信和 写 
要 写 入 HI 寄存 器 的 值 


要 写 入 LO 寄存 器 的 值 
HI 寄存 器 的 值 
LO 寄存 器 的 值 











A.14 CTRL 模块 接口 说 明 


CTRL 模 块 接口 如 图 A-14 所 示 ， 各 接口 的 描述 如 表 A-14 所 示 。 
CTRL 
excepttype_i new_pc 


cp0_epc 1 stall 








stallreq_from_ex flush 
stallreq_from_id 
rst 


Ctrl. y 
图 A-14 “CTRL 模块 的 外 部 接口 


表 A-14 CTRL 模块 的 接口 描述 


e A 

P| EY 

2 | stallzeq from id [1 | 输入 处 于 译 码 阶段 的 指令 是 否 请 求 流水 线 暂停 信号 

入 处 于 执行 阶段 的 指令 是 否 请 求 流水 线 和 暂停 信号 
暂停 流水 线 控制 信 入 

MA 最 终 的 异常 类 型 

2 


new_pc 3 偷 出 异常 处 理 入 口 地 址 
flush 1 mih 是 否 清除 流水 线 


w | | 一 























A 
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附录 B ”0penMIPS 实 现 的 所 有 指令 


RT PLAY AL BS AS 


Bl 逻辑 操作 指令 
































31 26 25 21 20 16 15 11 10 6 5 

SPECIAL AND 

000000 al rd Qono 100100 
SPECIAL OR 

000000 a rd am 100101 
SPECIAL XOR 

000000 ES rd 00000 100110 
SPECIAL NOR 

000000 is E 00990 100111 

ANDI f 

001100 rs immediate 

XORI ; 

001110 rs immediate 

Be 1 00000 immediate 

ORL rs immediate 
001101 




















and rd, rs, 1t 


or rd, rs, rt 


xor rd, rs, rt 


nor rd, rs, rt 


andi rt, rs, immediate 


xori rt, rs, immediate 


lui rt, immediate 


ori rs, rt, immediate 


B.2 移 位 操作 指令 




















31 26 25 21 20 16 15 11 10 

“000000 | 00000 rd = | nooo 
000000 | 20000 rd = | adoni 
p ae ‘ 00000 rd sa En 1 
ra | 向 m Re autos 
Ta. ® ra | aoa | noto 
ane rs rd 00000 eed 


























sll rd, rt, sa 


srl rd, rt, sa 


sra rd, rt, sa 


sllv rd, rt, rs 


srlv rd, rt, rs 


srav rd, rt, rs 


B3 移动 操作 指令 




















31 26 25 21 20 16 15 11 10 

maa] = |» | u | om | son 
| % rt rd 00000 rae 
a Si 00000 00000 rd 00000 te = 
a 00000 | 00000 rd 00000 ite 
= er rs 00000 00000 00000 A a 
pe rs 00000 | 00000 | 00000 ane, 














movn rd, ts, rt 


movz rd, ts, rt 


mfhi rd 


mflo rd 


mthi rs. 


mtlo rs 


B.4 算术 操作 指令 


31 


N 
D 


SPECIAL 





rs 


21 20 


16 15 


I 10 6 3 








rd 00000 


ADD 












































000000 


SPECIAL 
000000 


















000000 100000 
SPECIAL ADDU 
000000 ds zd 00000 100001 
SPECIAL SUB 
000000 i ra us 100010 
SPECIAL SUBU 
000000 = td 00000 100011 
SPECIAL SLT 
000000 rs d one 101010 
SPECIAL SLTU 
000000 = rd = 101011 
SPECIAL MULT 
000000 eN 00000 00000 011000 
SPECIAL MULTU 


00000 00000 






011001 


DIV 
011010 















011100 






SPECIAL DIVU 
000000 a ase 011011 

SPECIAL2 MADD 
011100 Man | 90090 000000 

SPECIAL2 MADDU 


00000 00000 





000001 



































001011 











SPECIAL2 MSUB 
11100 ts 00000 00000 100 
SPECIAL2 MSUBU 
011100 = 00000 00000 000101 
SPECIAL2 CLZ 
011100 di a N 100000 
SPECIAL? CLO 
011100 i ra 20000 100001 
SPECIAL2 MUL 
011100 = zg 00000 000010 
ADDI t's immediate 
001000 
ADDIU = mediate 
001001 immediate 
SLT rs immediate 
001010 
SLTIU ; , 
rs immediate 








add rd, rs, rt 


addu rd, rs, rt 


sub rd, rs, rt 


subu rd, rs, rt 


slt rd, rs, rt 


situ rd, rs, rt 


mult rs, st 


multu rs, st 


div rs, rt 


divu rs, rt 


madd rs, rt 


maddu rs, rt 


msub rs, rt 


msubu rs, rt 


clz rd, rs 


clo rd, rs 


mul rd, rs, st 


addi rt, rs, immediate 


addiu rt, rs, immediate 


siti rt, rs, immediate 


sitiu rt, rs, immediate 


B.5 转移 指令 



































31 26 25 21 20 16 15 11 10 6 5 0 

SPECIAL JR Ñ 

000000 j 001000 |F" 
SPECIAL JALR ee 

000000 i 001001 | jalr rs2%jalr rd, rs 

J : ~i . 

000010 instr_index j target 

Rey 1 instr_index jal target 

ee ns ri offset beq rs, rt, offset 

En 00000 00000 offset b offset 

En is 00000 offset bgtz rs, offset 

ie e ts 00000 offset blez rs, offset 

Rt ds rs rt offset bne rs, rt, offset 
REGIMM BLTZ 

000001 fs 00000 offset bltz rs, offset 
REGIMM BLTZAL 

000001 rs 10000 offset bltzal rs, offset 
REGIMM BGEZ 

000001 rs 00001 offset bgez rs, offset 
REGIMM BGEZAL 

000001 fs 10001 offset bgezal rs, offset 
REGIMM BGEZAL 

000001 | 00000 10001 offset bal offset 




















B.6 加载 存储 指令 




















31 26 25 21 20 16 15 0 
LB base rt offset lb rt, offset(base) 
100000 > 
ae base rt offset Ibu rt, offset(base) 
LH base rt offset Ih rt, offset(base) 
100001 l - 
tort | base rt offset Ihu rt, offset(base) 
i > | hase rt offset Iw rt, offset(base) 
> b rt ff b rt, offset(base) 
101000 ne offset sb rt, offset(base 
a b rt ffset sh rt, offset(base' 
101001 iad offse , offset(base) 
SW " 
101011 base rt offset sw tt, offset(base) 























LWL 
100010 base rt offset Iwl rt, offset(base) 
LWR 
100110 base rt offset Iwr rt, offset(base) 
se base rt offset swl rt, offset(base) 


101010 
SWR 











101110 base rt offset swr rt, offset(base) 
LL b rt ffset Il rt, offset(base) 
110000 sat ve i 
SC 
base rt offset sc rt, offset(base) 


111000 

















B.7 协 处 理 器 访问 指令 








31 26 25 21 20 16 15 11 10 32 
COPO MT 
010000 00100 | rt rd 00000000 sel 
COPO MF 
010000 00000 | rt rd 00000000 en 























mtcO rt, rd 


mfc0 rt, rd 
























































31 26 25 21 20 16 15 6 
SPECIAL TEQ 
000000 = u cogs 110100 
SPECIAL a P TGE 
000000 sé iii 110000 
SPECIAL P er TGEU 
000000 ES one 110001 
SPECIAL P P TLT 
000000 e coue 110010 
SPECIAL = P 4 TITU 
000000 — 110011 
SPECIAL d 3 TNE 
000000 2. SORE 110110 
REGIMM m TEQI Dennis 
000001 01100 A 
REGIMM m TGEI tia 
000001 01000 ee 
REGIMM TGEIU de 
000001 E 01001 NEES 
REGIMM rs TE immediate 
000001 01010 
REGIMM TLTIU u 
000001 a 01011 BUN 
REGIMM ES TNEI —e 
000001 01110 sa asi 
SPECIAL r SYSCALL 
000000 a 001100 
COP0 |co ERET 
anes | 4 0000 0000 0000 0000 000 Pere 

















teq rs, rt 


tge rs, rt 


tgeu rs, rt 


tlt rs, rt 


tltu rs, rt 


tne rs, rt 


teqi rs, immediate 


tgei rs, immediate 


tgeiu rs, immediate 


tlti rs, immediate 


tltiu rs, immediate 


tnei rs, immediate 


syscall 


eret 


B.9 


空 指令 及 其 他 指令 























31 26 25 21 20 16 15 11 10 6 
a | 00000 | 00000 | 0000 | 00000 poa 
SOAL | 00000 | 00000 | 00000 | 00001 Bn 
nooo | 00000 | 00000 | 00000 | 00001 an 

Krim base hint offset 


110011 








nop 


ssnop 


sync 


pref 


参考 文献 


L1] ke EG, Kin W2, Hin. 计算 机 体系 结构 
(第 2 版 ) LM]. 北京 : 高 等 教育 出 版 社 ，2005 


[2] kk, KÆ, EERE. BKE. CPU 自制 入 门 
IM]. 北京 人 民 邮 电 出 版 社 ，2014 


[3] 万 木 杨 .大 话 处 理 器 LM] . 北京 : 清华 大 学 出 版 社 ，2011 


[41] FER. 计算 机 原理 与 设计 





Verilog HDL 版 LM] . dk 


京 : 清华 大 学 出 版 社 ，2011 

[5] E&H. 数字 系统 设计 与 Verilog HDL (第 4 版 ) [IM]. dk 
京 : 电子 工业 出 版 社 ，2011 

[6] IMA, EEH, AUGE. MIPS 体 系 结构 与 编程 LM]. Je 
京 : 科学 出 版 社 ，2008 


[7] Dominic Sweetman. 李鹏 ， 鲍 峥 ， 石 洋 译 . MIPS 体 系 结构 透 
AL LM]. 北京 : 机 械 工 业 出 版 社 ，2008 


[8] WISHBONE System-on-Chip(SoC) Interconnection Architecture 
for Portable IP Cores Revision B.3. 2002.9 


[9] 徐 敏 . 开源 软 核 处 理 器 OpenRisc 的 SOPC 设 计 [M] . 北京 : 





北京 航空 航天 大 学 出 版 社 ，2008 


[10] Jean J. Labrosse. 邵 贝 贝 译 . 髋 入 式 实时 操作 系统 HC/OS- 
1 (#24) [IM]. 北京 : 北京 航空 航天 大 学 出 版 社 ，2003 





[11] AYE. 舱 入 式 系 统 开发 与 应 用 IM]. 北京 : 北京 航空 航天 
大 学 出 版 社 ，2005 


